백터 데이터 베이스는 복합 비 정형 데이터를 임베딩으로 변환하여서 유사도에따라 사용자의 쿼리를 유추해서 데이터를 조회하는 데이터베이스입니다.
뉴럴네트워크가 발달되면서 복합 비정형 데이터를 임베딩으로 빠르고 정확하게 변환할 수 있게됐습니다.
즉 어떠한 데이터가 들어오면 숫자로 변환한 다음 벡터형태로 변환하여서 저장할 수 있게 된것입니다.
딥 러닝 모델에 의한 임베딩 이후 시각화 한 데이터의 결과를 보면 비슷한 데이터끼리 응집돼 있는 결과가 나온 것을 발견했고, 기존의 key:value기반의 DB를 쓰자니 속도도 느리고 위 경우에 가장 적합한 데이터베이스를 찾은것이 백터 데이터베이스입니다.
Vectorizers
임베딩된 데이터에서 새로운데이터가 임베딩되서 들어왔을때 두가지 속성을 가진 아티클을 추가하게되면 각 속성간의 거리를 기반으로 측정을 한것입니다.
유사도 및 거리지표
- 점과 점 사이의 거리(Eudclidean distance)
- 각도기반 지표(cosine similarity)
'DB' 카테고리의 다른 글
MYSQL/성능개선을 위한 인덱스 정의시 알아두면 유용한 정보(쿼리 실행 계획) (0) | 2023.10.23 |
---|---|
Spark 개념 (0) | 2023.08.16 |