KAIST 아카식DB AI 환각 줄이는 차세대 데이터베이스 기술 개발
KAIST가 벡터 그래프 관계형 DB를 통합한 아카식DB로 AI 환각을 줄이고 정확도 78퍼센트 높인 기술을 분석한다
KAIST 연구진이 벡터, 그래프, 관계형 데이터베이스 기능을 하나로 통합한 차세대 데이터베이스 ‘아카식DB(AkasicDB)‘를 개발했습니다. 이를 기반으로 한 검색증강생성(RAG, AI가 답변을 만들 때 관련 문서를 먼저 검색해 근거로 활용하는 기술) 기법 ‘옴니RAG’는 AI 답변 정확도를 최대 78% 높이고 처리 속도는 최대 20배 향상시킨 것으로 나타났습니다.
기업용 AI 에이전트(스스로 데이터를 찾아 작업을 수행하는 AI 시스템)가 빠르게 확산되면서, 사실과 다른 답변을 만들어내는 환각(hallucination) 문제는 상용화의 가장 큰 걸림돌로 꼽혀 왔습니다. 이번 연구는 그 원인을 데이터베이스 구조 자체에서 찾아 해결했다는 점에서 의미가 있습니다. 이 글에서는 아카식DB의 작동 원리와 산업적 의미를 살펴봅니다.
아카식DB와 옴니RAG의 핵심 구조
아카식DB는 KAIST 전산학부 김민수 교수 연구팀이 교원창업기업 그래파이와 협력해 개발했습니다. 문서나 이미지의 의미를 숫자 벡터로 변환해 유사한 정보를 찾는 벡터 데이터베이스, 사람·기업·제품 등 개체 간 관계를 저장하고 분석하는 그래프 데이터베이스, 표 형태 데이터를 체계적으로 관리하는 관계형 데이터베이스를 하나의 시스템에서 통합 실행할 수 있도록 설계됐습니다.
이를 기반으로 한 옴니RAG는 문서의 의미 정보, 개체 간 관계, 구조화된 데이터를 동시에 활용해 AI가 더 정확하고 맥락에 맞는 답변을 생성하도록 돕습니다. 실험 결과 기존 시스템에서 최대 21.3초가 걸리던 복합 검색 질의를 1초 이내로 처리해 20배 이상의 성능 향상을 달성했고, 답변 정확도는 기존 RAG 대비 최대 78% 높아진 것으로 나타났습니다.
기존 RAG의 한계와 왜 지금 통합 DB인가
기존 RAG는 사용자 질문과 문서를 벡터로 변환한 뒤 의미적으로 유사한 문서를 검색해 거대언어모델에 제공하는 방식이 일반적이었습니다. 이 방식은 비정형 문서 검색에는 효과적이지만, 문서 속 개체 간 관계나 특정 기간·유형·범위 같은 구조화된 조건을 함께 고려해야 하는 복합 질의에는 한계가 있었습니다.
예를 들어 “작년에 체결된 계약서 중 A사와 관련된 조항을 찾고, 해당 조항이 어떤 제품 공급 이슈와 연결되는지 설명해 달라”는 질의를 처리하려면 벡터 검색, 그래프 검색, 관계형 질의가 동시에 필요합니다. 기존 시스템에서는 이를 위해 여러 종류의 데이터베이스를 별도로 구축하고 응용프로그램 단에서 결과를 결합해야 했기 때문에 관리 복잡성과 응답 지연이 발생할 수밖에 없었습니다. 아카식DB는 이 세 가지 검색을 하나의 SQL/GQL(구조화 질의어 및 그래프 질의어) 질의문으로 표현하고 단일 실행 계획으로 최적화함으로써 이 문제를 정면으로 해결했습니다.
글로벌 RAG 기술과의 비교
벡터DB와 그래프DB를 결합하려는 시도는 해외에서도 이어지고 있지만, 대부분 별도의 데이터베이스를 연동하는 방식에 머물러 있었습니다. 아카식DB는 세 가지 데이터베이스 기능을 하나의 엔진에서 통합 처리한다는 점에서 구조적으로 차별화됩니다.
이러한 차별점 덕분에 이번 연구는 데이터베이스 분야 최고 권위 국제학술대회인 ACM SIGMOD 2026에서 데모 논문으로 발표되어 글로벌 기업과 연구자들로부터 높은 관심을 받았습니다. 통합 구조를 통해 불필요한 중간 결과 생성과 데이터 이동을 최소화함으로써 거대언어모델의 토큰 사용량을 줄이고 응답 지연시간도 함께 단축한 점이 학계의 주목을 받은 핵심 포인트입니다.
국내 기업용 AI 시장에 미치는 영향
김민수 교수는 국방, 제조, 금융, 법률, 과학기술 등 고도의 신뢰성이 요구되는 분야에서 아카식DB가 핵심 데이터 인프라로 활용될 것으로 기대한다고 밝혔습니다. 실제로 금융이나 법률처럼 잘못된 정보가 큰 손실로 이어질 수 있는 산업에서는 환각 문제 해결이 AI 도입의 전제 조건이나 다름없습니다.
국내 기업 입장에서는 별도의 벡터DB, 그래프DB, 관계형DB를 따로 구축하고 운영하던 기존 방식 대비 인프라 운영 비용과 복잡성을 줄일 수 있다는 점이 실질적인 이점입니다. 다만 아직 데모 단계의 연구 성과인 만큼, 실제 상용 서비스로 전환되기까지의 안정성 검증과 산업 현장 적용 사례가 추가로 필요해 보입니다.
주목해야 할 포인트
이번 연구에서 가장 주목할 부분은 환각 문제를 모델 자체의 개선이 아니라 데이터 인프라 구조의 개선으로 풀어냈다는 접근 방식입니다. 거대언어모델의 성능을 끌어올리는 경쟁이 치열한 가운데, 데이터를 어떻게 저장하고 검색하느냐가 답변 품질을 좌우하는 또 하나의 축이라는 점을 보여준 사례입니다.
처리 속도가 최대 20배 빨라졌다는 점은 비용 효율성 측면에서도 의미가 큽니다. 토큰 사용량 감소는 곧 AI 운영 비용 절감으로 이어지기 때문에, 향후 기업들이 AI 에이전트 도입을 검토할 때 정확도뿐 아니라 비용 구조까지 함께 고려하는 흐름이 강화될 것으로 보입니다.
AI 환각 문제는 모델 성능만으로는 풀리지 않는 구조적 과제였습니다. 아카식DB는 데이터 인프라 차원의 해법이 기업용 AI 상용화의 다음 열쇠가 될 수 있음을 보여주는 사례입니다.
#아카식DB #KAISTAI #AI환각 #옴니RAG #벡터DB #그래프DB #기업용AI에이전트