[기술노트 117회] Oracle 23AI ─ 벡터 검색 테스트

 

[굿어스데이터] 기술노트117회_ORACLE_23AI_NF_VECTOR_SEARCH_TESTING.pdf
4.44MB

기술노트 117벡터 임베딩 & 유사도 검색 실습

안녕하세요. 굿어스데이터 기술그룹입니다.

이번 기술노트 #117에서는 Oracle 23AI Free 버전을 활용하여 ONNX 기반 임베딩 모델을 데이터베이스에 로드하고,

실제 데이터에 대한 벡터화 및 유사도 검색을 수행한 테스트 결과를 공유드립니다.

 

주요 목표

  • Oracle 23AI Free Edition에서 ONNX 텍스트 임베딩 모델을 로드
  • 텍스트 데이터를 벡터로 변환한 뒤, VECTOR_DISTANCE 함수를 이용한 유사도 검색 수행
  • COSINE을 활용한 다양한 거리 함수별 검색 결과 비교

 

테스트 환경 절차 요약

  • Oracle 제공 ONNX 모델 (all-MiniLM-L12-v2) 사용
  • DBMS_VECTOR.LOAD_ONNX_MODEL을 통해 모델 로드
  • VECTOR_EMBEDDING() 함수로 텍스트 → 벡터 변환
  • VECTOR_DISTANCE() 또는 <=> 연산자 활용 검색

 

실습 내용 하이라이트

  • 맛집추천, 여행추천 등의 키워드에 대한 Top-N 유사 문장 검색
  • 각 거리 측정 함수(COSINE)의 특징 비교
  • Standard Operator (<=>, <->, <#>)를 이용한 간결한 쿼리 작성 방식

 

실습 시 유용한 팁

Metric 특징 추천 상황
COSINE 방향 기반 유사도, 크기 무시 일반 문장 임베팅 (BERT, E5 등)
DOT 방향 및 크기 고려 OpenAI 임베딩 등 점수 기반 추천
L2 위치 기반 거리 계산 수치형 데이터, 정규화된 벡터
JACCARD/HAMMING 이진 벡터 해시 기반 표현, LSH
MANHATTAN 희소 벡터에 적합 TF-IDF, One-hot 등

 

 

첨부 문서

기술노트 117회 PDF 전문 ─ 「 23AI NF VECTOR SEARCH TESTING 」(작성자: 이정헌)

 

이 글을 공유하기

댓글

Designed by JB FACTORY