전체 개요
AI 검사기는 의미를 ‘이해’하지 않습니다. 단어의 통계적 패턴을 측정해 기계 생성 확률을 추정합니다. 핵심 아이디어는 두 가지 — perplexity와 burstiness — 이고, 여기에 학습된 분류기가 더해지기도 합니다.
Perplexity (예측 가능성)
다음 단어가 얼마나 예측 가능한지입니다. 언어모델은 확률 높은 ‘안전한’ 단어를 고르는 경향이 있어, 출력의 perplexity가 낮습니다. 사람 글은 의외의 단어 선택이 많아 보통 더 높습니다.
Burstiness (변동성)
문장 길이와 복잡도의 변화 폭입니다. 사람은 긴 문장 뒤에 짧은 문장을 두는 등 들쭉날쭉하지만, AI는 더 균일한 경향이 있습니다. 낮은 burstiness 역시 ‘AI 쪽’으로 점수를 밀어냅니다.
분류기 방식
최신 탐지기는 사람·AI 글 대량 표본으로 분류기를 학습시켜, 공식 하나로 표현하기 어려운 미세한 ‘지문’까지 잡습니다. 하지만 학습 범위를 벗어난 새 모델·문체·비원어민 글에서는 양쪽 모두 오류가 납니다.
왜 100% 정확할 수 없나
사람 글과 AI 글은 통계적으로 겹칩니다. 겹치는 한 어떤 기준선도 둘을 깔끔히 가르지 못하고, 오탐(억울한 사람)과 미탐(놓친 AI)을 맞바꿀 뿐입니다. 그래서 ‘100% 정확한 AI 탐지’는 존재하지 않습니다. 한계를 염두에 두고 직접 검사해보세요.
자주 묻는 질문
perplexity가 뭔가요?
단어 선택이 얼마나 예측 가능한지를 나타냅니다. AI 글은 보통 perplexity가 낮아 기계 신호로 해석됩니다.
왜 AI 탐지는 100%가 안 되나요?
사람과 AI 글의 통계적 특성이 겹치기 때문입니다. 탐지기는 오탐과 미탐을 맞바꿀 뿐, 둘 다 없앨 수는 없습니다.
⚠️ AI 탐지 점수는 확률적 신호이며 100% 정확하지 않습니다. 사람이 쓴 글을 AI로 오판할 수 있습니다. 부정행위·학사 평가의 단독 근거로 점수를 사용하지 마세요.