VAIV의 언어 모델인 VAIVGeM은 국내 최고 수준의
한국어 특화 초거대 언어 모델로, 응용 지향적이고,
공공기관, 도서관, 금융 등 도메인에 특화된 LLM을 제공합니다.
state-of-the-art 수준의 Polyglot 기반 한국어 특화 초거대 언어모델
01응용 지향적 LLM
태스크 맞춤형 instruction 생성 및 학습
검색 기반 모델과 결합한 생성형 기술로 환각 현상을 최소화한 다중 문서 요약 수행
데이터 요약 기능 및 각종 문서 작성 기능 향상을 위한 맞춤 instruction 학습
02도메인 전문적 LLM
공공기관, 도서관, 행정 문서 등 다양한 전문 도메인의 데이터 학습
금융 도메인에 관련된 다량의 데이터 학습
텍스트 외 그래프, 표 등 경제/공공 부문 다양한 비정형 데이터 처리 및 이해 기능 향상
03한국어 특화 LLM
한국어의 특성을 반영한 독자적인 instruction 생성 및 학습 (Wizard 방식)
거대 한국어 코퍼스 기반 튜닝
한국어의 모든 음절을 OOV 없이 강건하게 처리 가능 BBPE tokenizer 기반 학습
04강화학습 기반 LLM
사용자의 의도에 부합하는 답변 생성을 위한 instruction-following 모델
생성한 답변에 대한 사람의 피드백 점수를 reward model로 학습
사용자 만족도 점수가 높은 출력을 생성하도록 policy model 최적화
VAIV SearchGPT
VAIV Search는 검색 솔루션을 이용하여 문서를 검색하고,
VAIV GeM을 통해 핵심 내용에 대한 요약 결과를 제공합니다.
검색 결과를 기반으로 요약하기 때문에 hallucination 빈도가 낮고,
참조한 문서를 reference로 함께 제공하고 있어 요약 결과에 대한 2차 검증이 용이합니다.
또한 해당 서비스는 VAIV에서 보유하고 있는 뉴스, 소셜, 법률 등 다양한 문서에 대한 검색도 가능하지만,
내부 보유 문서에 대해서도 동일한 서비스가 가능합니다.
VAIV Smartchat
보유 데이터를 입력만 하면 자동으로 질의-응답 셋 지식을 생성하여
지식 기반 챗봇을 사용할 수 있도록 지원하는 VAIV SmartChat
보통 챗봇 서비스를 이용하기 위해서는 질의-응답(Q-A) 페어에 대한 지식을 보유하고 있어야 합니다.
하지만, 이러한 지식을 보유하지 않는 경우가 대부분이고, 관련 지식을 구축하는데 많은 비용이 소요됩니다.
VAIV SmartChat는 VAIVGeM을 이용해 보유 데이터를 입력만 하면 자동으로 질의-응답 셋 지식을 생성하여 지식 기반 챗봇을 사용할 수 있도록 지원합니다.
그리고 별도의 controller를 통해 사용자의 질의에 맞는 응답을 제공합니다.