OpenAlex(4.8억+ 논문) · Semantic Scholar · PubMed · CrossRef 4개 학술 DB에서 인용 논문의 실재 여부를 자동 확인합니다. 존재하지 않는 DOI, 허위 저자-연도 인용, 가공된 저널 게재 주장을 실시간으로 탐지·교정합니다.
{ "claim": "Kim et al. (2021)은 Nature에 해당 모델을 발표했다.",
"verdict": "contradicted",
"reason": "학술 DB 어디에서도 해당 논문 확인 불가 — 허위 인용 가능성",
"academic_db": ["OpenAlex", "S2", "PubMed", "CrossRef"],
"match_count": 0 }
{ "claim": "Vaswani et al. (2017)은 Transformer 아키텍처를 제안했다.",
"verdict": "supported",
"doi": "10.1038/s41586-023-xxxxx",
"citations": 1,247 }
// 허위 인용 1건 탐지 · DOI 검증 완료 1건 · 교정문 자동 생성
0.0%
할루시네이션 탐지율 (500건)?
Auto
자동 교정?
<2s
3단계 방어 최대 지연?
0+
지원 문서 포맷?
0
가드레일 규칙?
0
검증 카테고리?
학술 DB 횡단 검증
모든 인용은 OpenAlex · Semantic Scholar · PubMed · CrossRef 에 동시에 질의됩니다. 4개 DB 어디에서도 근거를 찾지 못하면, LLM이 지어낸 허위 인용일 가능성이 높습니다.
Kim et al. (2021) "Self-Healing Transformers for Low-Resource NLP"
판정: 허위 인용 가능성 — FABRICATED
4개 학술 DB 어디에서도 해당 논문이 확인되지 않았습니다. 연구자 리포트·논문에서 이 인용을 사용하기 전에 원문을 직접 확인해야 합니다.
문서 지원
한글(HWP/HWPX)을 포함한 주요 문서 포맷을 모두 지원합니다. 어떤 원본 문서든 업로드하면 자동으로 분석하고 검증 근거로 활용합니다.
한글과컴퓨터의 HWP(OLE 바이너리)와 HWPX(ZIP/XML) 포맷을 모두 네이티브로 지원합니다. 표, 텍스트, 서식을 정확하게 추출합니다.
PyMuPDF 엔진으로 텍스트, 표, 레이아웃을 정밀하게 추출합니다.
Microsoft Word 문서의 문단, 표, 스타일을 그대로 파싱합니다.
일반 텍스트와 마크다운 문서를 바로 분석합니다.
웹 페이지 HTML에서 스크립트/스타일을 제거하고 본문만 추출합니다.
업로드된 문서는 자동으로 텍스트 추출 → 의미 단위 청킹 → E5 벡터 임베딩 → 지식그래프 구축까지 한 번에 처리됩니다.
기술
시맨틱 벡터 검색과 신경망 자연어 추론을 결합한 클레임 단위 검증 파이프라인입니다.
38개 규칙 · 지연 <1ms
컴플라이언스 규칙(CG-001~028), 수치 교차검증, 할루시네이션 패턴 매칭으로 즉시 탐지합니다. 전체 탐지의 73%를 1ms 이내에 처리합니다.
DeBERTa-v3 Cross-Encoder · 지연 ~50ms
클레임-근거 쌍을 크로스인코더 NLI 모델로 지지/모순/중립 판정합니다. 지식그래프 기반 구조화된 근거를 함께 활용합니다.
DeepSeek/Claude · 지연 ~2s
NLI에서 미확인(neutral)으로 판정된 클레임을 LLM이 원본 근거 기반으로 2차 재검증합니다. 최종 탐지율 96.8%를 달성합니다.
DataForSEO SERP API · 지연 ~3s
업로드 문서 외에도 웹 검색 결과를 실시간으로 수집하여 추가 근거로 활용합니다. 문서 없이도 웹 소스만으로 팩트체크가 가능하며, 각 클레임별 출처 URL과 유사도를 함께 제공합니다.
LLM 기반 · 원본 근거 참조
모순으로 판정된 클레임에 대해 원본 문서 근거를 기반으로 정확한 수정문을 자동 생성합니다. 원문의 문체를 유지하면서 사실만 교정하여 바로 사용 가능한 corrected_text를 제공합니다.
탐지 메커니즘별 기여도
탐지율 개선 추이
500건 벤치마크 기준 5라운드 진화
TruthAnchor v3.2.0 · 500건 검증 완료 · 31개 카테고리
카테고리별 성과
체험하기
LLM이 생성한 텍스트를 붙여넣고 HalluGuard의 3단계 검증 결과를 확인하세요.
* 체험용 시뮬레이션입니다. 실제 검증은 로그인 후 이용 가능합니다.
작동 방식
검증 기준이 될 원본 문서를 업로드합니다. PDF, DOCX, HWP, HWPX, TXT, MD, HTML을 지원하며, 문서를 자동으로 청킹하고 벡터 임베딩합니다.
LLM 출력물에서 개별 사실 주장(claim)을 자동 추출합니다.
E5-large 모델로 각 클레임에 대한 관련 근거를 시맨틱 검색합니다.
DeBERTa-v3 크로스인코더로 지지/모순/중립을 판정합니다.
웹 검색 엔진을 통해 실시간으로 외부 소스를 수집하고, 업로드 문서와 함께 하이브리드 근거로 활용합니다.
모순 판정된 클레임을 원본 근거 기반으로 자동 교정하여, 바로 사용 가능한 수정 텍스트를 생성합니다.
요금제
무료 요금제로 시작하세요. 신용카드 불필요.
서비스 제공기간: 결제일로부터 1개월
Enterprise