NLI 기반 팩트 검증
PDF, DOCX, HWP, HWPX 등 모든 문서 포맷을 지원합니다. 원본 문서를 기반으로 AI가 생성한 텍스트의 모든 주장을 문장 단위로 분석하고, 할루시네이션을 자동 탐지·교정합니다.
{ "claim": "한국의 GDP는 2023년 기준 약 1.7조 달러입니다.",
"verdict": "supported", "confidence": 0.94 }
{ "claim": "서울의 인구는 약 1,500만 명입니다.",
"verdict": "contradicted", "confidence": 0.97,
"correction": "실제 서울 인구는 약 950만 명입니다." }
{ "claim": "이 펀드에 투자하면 수익이 확실합니다.",
"verdict": "contradicted", "rule": "CG-002",
"correction": "이 펀드는 수익이 보장되지 않으며, 원금 손실 위험이 있습니다." }
// corrected_text 자동 생성 완료 — 모순 클레임이 원본 근거 기반으로 교정됨
96.8%
할루시네이션 탐지율 (500건)?
Auto
자동 교정?
<2s
3단계 방어 최대 지연?
7+
지원 문서 포맷?
38
가드레일 규칙?
31
검증 카테고리?
문서 지원
한글(HWP/HWPX)을 포함한 주요 문서 포맷을 모두 지원합니다. 어떤 원본 문서든 업로드하면 자동으로 분석하고 검증 근거로 활용합니다.
한글과컴퓨터의 HWP(OLE 바이너리)와 HWPX(ZIP/XML) 포맷을 모두 네이티브로 지원합니다. 표, 텍스트, 서식을 정확하게 추출합니다.
PyMuPDF 엔진으로 텍스트, 표, 레이아웃을 정밀하게 추출합니다.
Microsoft Word 문서의 문단, 표, 스타일을 그대로 파싱합니다.
일반 텍스트와 마크다운 문서를 바로 분석합니다.
웹 페이지 HTML에서 스크립트/스타일을 제거하고 본문만 추출합니다.
업로드된 문서는 자동으로 텍스트 추출 → 의미 단위 청킹 → E5 벡터 임베딩 → 지식그래프 구축까지 한 번에 처리됩니다.
기술
시맨틱 벡터 검색과 신경망 자연어 추론을 결합한 클레임 단위 검증 파이프라인입니다.
38개 규칙 · 지연 <1ms
컴플라이언스 규칙(CG-001~028), 수치 교차검증, 할루시네이션 패턴 매칭으로 즉시 탐지합니다. 전체 탐지의 73%를 1ms 이내에 처리합니다.
DeBERTa-v3 Cross-Encoder · 지연 ~50ms
클레임-근거 쌍을 크로스인코더 NLI 모델로 지지/모순/중립 판정합니다. 지식그래프 기반 구조화된 근거를 함께 활용합니다.
DeepSeek/Claude · 지연 ~2s
NLI에서 미확인(neutral)으로 판정된 클레임을 LLM이 원본 근거 기반으로 2차 재검증합니다. 최종 탐지율 96.8%를 달성합니다.
DataForSEO SERP API · 지연 ~3s
업로드 문서 외에도 웹 검색 결과를 실시간으로 수집하여 추가 근거로 활용합니다. 문서 없이도 웹 소스만으로 팩트체크가 가능하며, 각 클레임별 출처 URL과 유사도를 함께 제공합니다.
LLM 기반 · 원본 근거 참조
모순으로 판정된 클레임에 대해 원본 문서 근거를 기반으로 정확한 수정문을 자동 생성합니다. 원문의 문체를 유지하면서 사실만 교정하여 바로 사용 가능한 corrected_text를 제공합니다.
탐지 메커니즘별 기여도
탐지율 개선 추이
500건 벤치마크 기준 5라운드 진화
TruthAnchor v3.2.0 · 500건 검증 완료 · 31개 카테고리
카테고리별 성과
체험하기
LLM이 생성한 텍스트를 붙여넣고 HalluGuard의 3단계 검증 결과를 확인하세요.
* 체험용 시뮬레이션입니다. 실제 검증은 로그인 후 이용 가능합니다.
작동 방식
검증 기준이 될 원본 문서를 업로드합니다. PDF, DOCX, HWP, HWPX, TXT, MD, HTML을 지원하며, 문서를 자동으로 청킹하고 벡터 임베딩합니다.
LLM 출력물에서 개별 사실 주장(claim)을 자동 추출합니다.
E5-large 모델로 각 클레임에 대한 관련 근거를 시맨틱 검색합니다.
DeBERTa-v3 크로스인코더로 지지/모순/중립을 판정합니다.
웹 검색 엔진을 통해 실시간으로 외부 소스를 수집하고, 업로드 문서와 함께 하이브리드 근거로 활용합니다.
모순 판정된 클레임을 원본 근거 기반으로 자동 교정하여, 바로 사용 가능한 수정 텍스트를 생성합니다.
요금제
무료 요금제로 시작하세요. 신용카드 불필요.
서비스 제공기간: 결제일로부터 1개월
Enterprise