v1.0.2 Stable

AI Detector API Documentation

KLUE-BERT 기반 한국어 텍스트 AI 생성 여부 탐지 및 Kiwi 형태소 분석기를 활용한 언어학적 분석 데이터를 제공하는 API입니다. Flask 서버와 상호작용하여 AI 확률, 토큰 중요도(Heatmap), 문장 복잡도 등을 반환합니다. 저희는 이 모델이 쇼핑몰 등에 적용되어 사용자들이 가장 합리적인 소비를 할수 있는 것을 목표로 하고 있습니다.

사용 가능한 모델

PRODUCTION

BERT + Gemini Pro

실 서비스용 고성능 파이프라인. 가장 정확한 분석 결과를 제공합니다.

klue-bert-gemini-pro

DEMO ONLY

BERT + Gemini Flash

발표 및 시연용 경량화 모델. 빠른 응답 속도를 가집니다.

klue-bert-gemini-flash

DEMO ONLY

BERT + ChatGPT 5.1

비교 분석용 데모 파이프라인입니다.

klue-bert-chatgpt-5.1

API 엔드포인트

POST /{model_id}/analyze 텍스트 분석 요청

선택한 모델을 사용하여 텍스트가 사람이 작성한 것인지 AI가 생성한 것인지 판별합니다. 기본 엔드포인트 /analyze 요청 시 Production 모델이 사용됩니다.

Request Body (JSON)

{
  "text": "분석할 한국어 텍스트 본문입니다...",  // 필수: 분석 대상 텍스트
  "with_html": true                            // 선택: 히트맵 HTML 반환 여부 (기본값 false)
}

GET /health 서버 상태 확인

서버 상태, 기본 모델 ID, Kiwi 형태소 분석기 활성화 여부 등을 반환합니다.

응답 데이터 구조

분석 요청 성공 시 반환되는 JSON 데이터의 예시입니다. linguistics 필드는 텍스트의 언어학적 특징(단어 빈도, 가독성 등)을 포함합니다.

{
  "success": true,
  "result": {
    "label": "ai",               // 최종 판정 (human | ai)
    "scores": {
      "ai": 98.5,              // 보정된 AI 확률 (0~100%)
      "human": 1.5,            // 보정된 사람 확률 (0~100%)
      "raw_ai": 0.9992         // Softmax 원본 확률 (0.0~1.0)
    },
    "token_scores": [          // 토큰 중요도 (Heatmap용)
      { "piece": "인공지능", "score": 0.85 },
      ...
    ],
    "linguistics": {           // 언어학적 분석 데이터 (Kiwi)
      "readability": {
         "avg_sentence_length": 12.5,
         "top_endings": [...]  // 문장 종결 어미 분포
      },
      "pos_distribution_grouped": {
         "NOUN": 45.2,
         "VERB": 20.1
      },
      "ttr": 0.65              // Type-Token Ratio (어휘 다양성)
    },
    "html": "<span style='...'>인공지능</span>..." // with_html=true 일 때만
  }
}