분석 결과
Human-Written
0%
AI-Generated
0%
토큰 분석 (Heatmap)
텍스트가 초록색에 가까울수록 'Human', 붉은색에 가까울수록 'AI' 확률이 높습니다.
언어학적 분석
품사 분포 (Grouped)
단어 길이 분포
주요 전환어
가독성 지표
상위 빈도 단어 (Top 30)
언어학적 분석이 비활성화되었거나 데이터를 불러올 수 없습니다.
GEMINI 2.5 PRO with klue-bert Detector
Human vs Generated AI Text Classification Model
v1.0.2 Stable
Project Team
Click for Profile
CSGE
영재교육원
교수님
손남례 교수님
박유건
박유건
서예찬
전처리
신민혁
전처리
임건우
전처리
손성하
전처리
김서후
전처리
학습 환경 (Environment)
GPU / RAM
RTX 3060 Ti / 192GB
Framework
PyTorch + HF
Params
Batch 16 / Epoch 3
Total Time
~3 Hours
Optimizer
AdamW (LR 3e-5)
Loss Fn
Cross Entropy
데이터셋 (Dataset)
Human Data
AI Hub
속성기반 감정분석 데이터 (20개 카테고리)
AI Data
생성 시간: 120시간
Gemini 2.5 Pro (Gem 기능 + 프롬프트 엔지니어링)
Total Dataset Size
251,354 Sentences
학습 카테고리 (20 Classes)
패션
여성의류
남성의류
패션슈즈
잡화
남성의류
패션슈즈
잡화
화장품
스킨케어
헤어/바디
뷰티소품
남성화장품
헤어/바디
뷰티소품
남성화장품
가전
영상/음향
생활/미용
주방가전
계절가전
생활/미용
주방가전
계절가전
IT 기기
컴퓨터 주변
휴대폰
카메라/태블릿
자동차기기
휴대폰
카메라/태블릿
자동차기기
생활
주방용품
위생용품
청소/세탁
세제/탈취
위생용품
청소/세탁
세제/탈취
일상적인 소비 활동에 대한 리뷰를 주로 학습했습니다
성능 지표 (Performance)
Test Accuracy
99.99%
Precision
0.99984
Recall
0.99996
F1 Score
0.99989