[기술노트 117회] Oracle 23AI ─ 벡터 검색 테스트
- 데이터 Tech
- 2025. 5. 29. 09:37
[굿어스데이터] 기술노트117회_ORACLE_23AI_NF_VECTOR_SEARCH_TESTING.pdf
4.44MB
기술노트 117회 – 벡터 임베딩 & 유사도 검색 실습
안녕하세요. 굿어스데이터 기술그룹입니다.
이번 기술노트 #117에서는 Oracle 23AI Free 버전을 활용하여 ONNX 기반 임베딩 모델을 데이터베이스에 로드하고,
실제 데이터에 대한 벡터화 및 유사도 검색을 수행한 테스트 결과를 공유드립니다.
주요 목표
- Oracle 23AI Free Edition에서 ONNX 텍스트 임베딩 모델을 로드
- 텍스트 데이터를 벡터로 변환한 뒤, VECTOR_DISTANCE 함수를 이용한 유사도 검색 수행
- COSINE을 활용한 다양한 거리 함수별 검색 결과 비교
테스트 환경 및 절차 요약
- Oracle 제공 ONNX 모델 (all-MiniLM-L12-v2) 사용
- DBMS_VECTOR.LOAD_ONNX_MODEL을 통해 모델 로드
- VECTOR_EMBEDDING() 함수로 텍스트 → 벡터 변환
- VECTOR_DISTANCE() 또는 <=> 연산자 활용 검색
실습 내용 하이라이트
- 맛집추천, 여행추천 등의 키워드에 대한 Top-N 유사 문장 검색
- 각 거리 측정 함수(COSINE)의 특징 비교
- Standard Operator (<=>, <->, <#>)를 이용한 간결한 쿼리 작성 방식
실습 시 유용한 팁
| Metric | 특징 | 추천 상황 |
| COSINE | 방향 기반 유사도, 크기 무시 | 일반 문장 임베팅 (BERT, E5 등) |
| DOT | 방향 및 크기 고려 | OpenAI 임베딩 등 점수 기반 추천 |
| L2 | 위치 기반 거리 계산 | 수치형 데이터, 정규화된 벡터 |
| JACCARD/HAMMING | 이진 벡터 | 해시 기반 표현, LSH |
| MANHATTAN | 희소 벡터에 적합 | TF-IDF, One-hot 등 |
첨부 문서
기술노트 117회 PDF 전문 ─ 「 23AI NF VECTOR SEARCH TESTING 」(작성자: 이정헌)
'데이터 Tech' 카테고리의 다른 글
| [기술노트 118회] Oracle Partition New Feature 12c to 23ai (0) | 2025.12.09 |
|---|---|
| [기술노트 116회] YTT 시리즈 ① - 템플릿 엔진 알아보기 (0) | 2024.02.27 |
| [기술노트 115회] Multitenent 환경Backup & Recovery (0) | 2021.03.23 |
| [기술노트 114회] Migration_Non-CDB to PDB (0) | 2021.02.17 |
| [기술노트 113회] Multitenant_installation (0) | 2021.01.28 |
이 글을 공유하기





