DB

백터 데이터베이스 개념

25G 2023. 5. 24. 09:34

백터 데이터 베이스는 복합 비 정형 데이터를 임베딩으로 변환하여서 유사도에따라 사용자의 쿼리를 유추해서 데이터를 조회하는 데이터베이스입니다.

뉴럴네트워크가 발달되면서 복합 비정형 데이터를 임베딩으로 빠르고 정확하게 변환할 수 있게됐습니다.

 

즉 어떠한 데이터가 들어오면 숫자로 변환한 다음 벡터형태로 변환하여서 저장할 수 있게 된것입니다. 

 

딥 러닝 모델에 의한 임베딩 이후 시각화 한 데이터의 결과를 보면 비슷한 데이터끼리 응집돼 있는 결과가 나온 것을 발견했고, 기존의 key:value기반의 DB를 쓰자니 속도도 느리고 위 경우에 가장 적합한 데이터베이스를 찾은것이 백터 데이터베이스입니다. 

 

 

Vectorizers

임베딩된 데이터에서 새로운데이터가 임베딩되서 들어왔을때 두가지 속성을 가진 아티클을 추가하게되면 각 속성간의 거리를 기반으로 측정을 한것입니다.

 

유사도 및 거리지표

- 점과 점 사이의 거리(Eudclidean distance)

- 각도기반 지표(cosine similarity)