NLI 기반 팩트 검증
PDF, DOCX, HWP, HWPX 등 모든 문서 포맷을 지원합니다. 원본 문서를 기반으로 AI가 생성한 텍스트의 모든 주장을 문장 단위로 분석하고, 할루시네이션을 자동 탐지·교정합니다.
{ "claim": "한국의 GDP는 2023년 기준 약 1.7조 달러입니다.",
"verdict": "supported", "confidence": 0.94 }
{ "claim": "서울의 인구는 약 1,500만 명입니다.",
"verdict": "contradicted", "confidence": 0.97,
"correction": "실제 서울 인구는 약 950만 명입니다." }
{ "claim": "이 펀드에 투자하면 수익이 확실합니다.",
"verdict": "contradicted", "rule": "CG-002",
"correction": "이 펀드는 수익이 보장되지 않으며, 원금 손실 위험이 있습니다." }
// corrected_text 자동 생성 완료 — 모순 클레임이 원본 근거 기반으로 교정됨
96.8%
할루시네이션 탐지율 (500건)?
Auto
자동 교정?
<2s
3단계 방어 최대 지연?
7+
지원 문서 포맷?
38
가드레일 규칙?
31
검증 카테고리?
문서 지원
한글(HWP/HWPX)을 포함한 주요 문서 포맷을 모두 지원합니다. 어떤 원본 문서든 업로드하면 자동으로 분석하고 검증 근거로 활용합니다.
한글과컴퓨터의 HWP(OLE 바이너리)와 HWPX(ZIP/XML) 포맷을 모두 네이티브로 지원합니다. 표, 텍스트, 서식을 정확하게 추출합니다.
PyMuPDF 엔진으로 텍스트, 표, 레이아웃을 정밀하게 추출합니다.
Microsoft Word 문서의 문단, 표, 스타일을 그대로 파싱합니다.
일반 텍스트와 마크다운 문서를 바로 분석합니다.
웹 페이지 HTML에서 스크립트/스타일을 제거하고 본문만 추출합니다.
업로드된 문서는 자동으로 텍스트 추출 → 의미 단위 청킹 → E5 벡터 임베딩 → 지식그래프 구축까지 한 번에 처리됩니다.
기술
시맨틱 벡터 검색과 신경망 자연어 추론을 결합한 클레임 단위 검증 파이프라인입니다.
38개 규칙 · 지연 <1ms
컴플라이언스 규칙(CG-001~028), 수치 교차검증, 할루시네이션 패턴 매칭으로 즉시 탐지합니다. 전체 탐지의 73%를 1ms 이내에 처리합니다.
DeBERTa-v3 Cross-Encoder · 지연 ~50ms
클레임-근거 쌍을 크로스인코더 NLI 모델로 지지/모순/중립 판정합니다. 지식그래프 기반 구조화된 근거를 함께 활용합니다.
DeepSeek/Claude · 지연 ~2s
NLI에서 미확인(neutral)으로 판정된 클레임을 LLM이 원본 근거 기반으로 2차 재검증합니다. 최종 탐지율 96.8%를 달성합니다.
LLM 기반 · 원본 근거 참조
모순으로 판정된 클레임에 대해 원본 문서 근거를 기반으로 정확한 수정문을 자동 생성합니다. 원문의 문체를 유지하면서 사실만 교정하여 바로 사용 가능한 corrected_text를 제공합니다.
탐지 메커니즘별 기여도
탐지율 개선 추이
500건 벤치마크 기준 5라운드 진화
TruthAnchor v3.2.0 · 500건 검증 완료 · 31개 카테고리
카테고리별 성과
체험하기
LLM이 생성한 텍스트를 붙여넣고 HalluGuard의 3단계 검증 결과를 확인하세요.
* 체험용 시뮬레이션입니다. 실제 검증은 로그인 후 이용 가능합니다.
작동 방식
검증 기준이 될 원본 문서를 업로드합니다. PDF, DOCX, HWP, HWPX, TXT, MD, HTML을 지원하며, 문서를 자동으로 청킹하고 벡터 임베딩합니다.
LLM 출력물에서 개별 사실 주장(claim)을 자동 추출합니다.
E5-large 모델로 각 클레임에 대한 관련 근거를 시맨틱 검색합니다.
DeBERTa-v3 크로스인코더로 지지/모순/중립을 판정합니다.
모순 판정된 클레임을 원본 근거 기반으로 자동 교정하여, 바로 사용 가능한 수정 텍스트를 생성합니다.
요금제
무료 요금제로 시작하세요. 신용카드 불필요.