Text embeddings: 텍스트를 임베디드 숫자로 변경, 비 정형 data를 수치상으로 변경해서 vector 그래프로 표시가 가능
구분 | 기업명 | 모델명 | 장단점 |
유료 임베딩 모델 | OpenAI Cohere Amazon |
text-embedding-ada-002 embed-multilingual-v2.0- titan-embed-text-v1 |
- 사용하기 편리하지만 비용 발생 - API 통신 이용하므로 보안 우려 - 한국어 포함 많은 언어 임베딩 지원 - GPU 없이도 빠른 임베딩 |
로컬 임베딩 모델 | HuggingFace | bge-large-en-v1.5 multilingual-e5-large instructor-xl ko-sbert-nli KoSimCSE-roberta-multitask |
- 무료지만 다소 어려운 사용 - 오픈소스 모델 사용하므로 보안 우수 - 모델마다 지원 언어가 다름 - GPU 없으면 느린 임베딩 |
'Computer Theory > LLM' 카테고리의 다른 글
Retrival - Vectorstore (0) | 2023.12.28 |
---|---|
랭체인의 Retrival-text splitters (0) | 2023.12.28 |
랭체인의 핵심 (0) | 2023.12.28 |
LangChain - PromptTemplate, LLM 프롬포트 입력을 더 편하게 (2) | 2023.12.28 |
LangChain으로 ChatGPT API 활용 (0) | 2023.12.27 |