NLI 기반 팩트 검증

LLM 출력물,
탐지하고 자동 교정하세요

PDF, DOCX, HWP, HWPX 등 모든 문서 포맷을 지원합니다. 원본 문서를 기반으로 AI가 생성한 텍스트의 모든 주장을 문장 단위로 분석하고, 할루시네이션을 자동 탐지·교정합니다.

할루시네이션 탐지자동 교정
verification-result.json

{ "claim": "한국의 GDP는 2023년 기준 약 1.7조 달러입니다.",

"verdict": "supported", "confidence": 0.94 }

 

{ "claim": "서울의 인구는 약 1,500만 명입니다.",

"verdict": "contradicted", "confidence": 0.97,

"correction": "실제 서울 인구는 약 950만 명입니다." }

 

{ "claim": "이 펀드에 투자하면 수익이 확실합니다.",

"verdict": "contradicted", "rule": "CG-002",

"correction": "이 펀드는 수익이 보장되지 않으며, 원금 손실 위험이 있습니다." }

 

// corrected_text 자동 생성 완료 — 모순 클레임이 원본 근거 기반으로 교정됨

96.8%

할루시네이션 탐지율 (500건)?

Auto

자동 교정?

<2s

3단계 방어 최대 지연?

7+

지원 문서 포맷?

38

가드레일 규칙?

31

검증 카테고리?

문서 지원

모든 문서 포맷을 지원합니다

한글(HWP/HWPX)을 포함한 주요 문서 포맷을 모두 지원합니다. 어떤 원본 문서든 업로드하면 자동으로 분석하고 검증 근거로 활용합니다.

한국 공공기관 표준
.hwp.hwpx

한글 (HWP/HWPX)

한글과컴퓨터의 HWP(OLE 바이너리)와 HWPX(ZIP/XML) 포맷을 모두 네이티브로 지원합니다. 표, 텍스트, 서식을 정확하게 추출합니다.

.pdf

PDF

PyMuPDF 엔진으로 텍스트, 표, 레이아웃을 정밀하게 추출합니다.

.docx

DOCX

Microsoft Word 문서의 문단, 표, 스타일을 그대로 파싱합니다.

.txt.md

TXT / Markdown

일반 텍스트와 마크다운 문서를 바로 분석합니다.

.html

HTML

웹 페이지 HTML에서 스크립트/스타일을 제거하고 본문만 추출합니다.

자동 전처리 파이프라인

업로드된 문서는 자동으로 텍스트 추출 → 의미 단위 청킹 → E5 벡터 임베딩 → 지식그래프 구축까지 한 번에 처리됩니다.

Upload7 formats
ParseAuto
ChunkSemantic
EmbedE5-large
KGNeo4j

기술

최신 NLI 연구 기반의 검증 엔진

시맨틱 벡터 검색과 신경망 자연어 추론을 결합한 클레임 단위 검증 파이프라인입니다.

Layer 1 — 가드레일 규칙 엔진

38개 규칙 · 지연 <1ms

컴플라이언스 규칙(CG-001~028), 수치 교차검증, 할루시네이션 패턴 매칭으로 즉시 탐지합니다. 전체 탐지의 73%를 1ms 이내에 처리합니다.

Layer 2 — NLI 의미적 검증

DeBERTa-v3 Cross-Encoder · 지연 ~50ms

클레임-근거 쌍을 크로스인코더 NLI 모델로 지지/모순/중립 판정합니다. 지식그래프 기반 구조화된 근거를 함께 활용합니다.

Layer 3 — LLM-as-Judge

DeepSeek/Claude · 지연 ~2s

NLI에서 미확인(neutral)으로 판정된 클레임을 LLM이 원본 근거 기반으로 2차 재검증합니다. 최종 탐지율 96.8%를 달성합니다.

자동 교정 엔진

LLM 기반 · 원본 근거 참조

모순으로 판정된 클레임에 대해 원본 문서 근거를 기반으로 정확한 수정문을 자동 생성합니다. 원문의 문체를 유지하면서 사실만 교정하여 바로 사용 가능한 corrected_text를 제공합니다.

탐지 메커니즘별 기여도

Guardrails
50%<1ms
Numerical
14%<1ms
Pattern
9%<1ms
NLI
2%~50ms
LLM Judge
40%~2s

탐지율 개선 추이

500건 벤치마크 기준 5라운드 진화

탐지율
오탐율

TruthAnchor v3.2.0 · 500건 검증 완료 · 31개 카테고리

카테고리별 성과

100% 탐지23 카테고리
90%+ 탐지4 카테고리
검증 완료 클레임500
가드레일 규칙 수38

체험하기

할루시네이션 탐지를 직접 체험하세요

LLM이 생성한 텍스트를 붙여넣고 HalluGuard의 3단계 검증 결과를 확인하세요.

* 체험용 시뮬레이션입니다. 실제 검증은 로그인 후 이용 가능합니다.

작동 방식

5단계 검증·교정 파이프라인

1

원본 업로드

검증 기준이 될 원본 문서를 업로드합니다. PDF, DOCX, HWP, HWPX, TXT, MD, HTML을 지원하며, 문서를 자동으로 청킹하고 벡터 임베딩합니다.

2

클레임 추출

LLM 출력물에서 개별 사실 주장(claim)을 자동 추출합니다.

3

근거 매칭

E5-large 모델로 각 클레임에 대한 관련 근거를 시맨틱 검색합니다.

4

NLI 판정

DeBERTa-v3 크로스인코더로 지지/모순/중립을 판정합니다.

5

자동 교정

모순 판정된 클레임을 원본 근거 기반으로 자동 교정하여, 바로 사용 가능한 수정 텍스트를 생성합니다.

요금제

합리적인 가격, 강력한 검증

무료 요금제로 시작하세요. 신용카드 불필요.

Free

무료
  • 월 15회 검증
  • 월 5회 AI 생성
  • 파일당 50MB
  • 저장소 100MB
  • 프로젝트 1개
시작하기

추천

Pro

₩69,000/월
  • 월 500회 검증
  • 월 200회 AI 생성
  • 파일당 50MB
  • 저장소 2GB
  • 프로젝트 10개
  • 팀 3명
시작하기

Business

₩199,000/월
  • 월 2,000회 검증
  • 월 1,000회 AI 생성
  • 파일당 100MB
  • 저장소 10GB
  • 프로젝트 50개
  • 팀 10명
  • API 접근
  • 분석 대시보드
시작하기

Enterprise

별도 협의
  • 무제한 검증 · 생성
  • 파일당 200MB
  • 저장소 100GB
  • 온프레미스 배포
  • SLA 보장
  • 전담 매니저
  • 맞춤 연동
도입 문의

지금 LLM 출력물 검증을 시작하세요.

무료 요금제로 월 20회 검증. 신용카드 불필요.

무료로 시작하기