AI 검사기는 어떻게 작동할까? (원리 쉽게)

전체 개요

AI 검사기는 의미를 ‘이해’하지 않습니다. 단어의 통계적 패턴을 측정해 기계 생성 확률을 추정합니다. 핵심 아이디어는 두 가지 — perplexity와 burstiness — 이고, 여기에 학습된 분류기가 더해지기도 합니다.

다음 단어가 얼마나 예측 가능한지입니다. 언어모델은 확률 높은 ‘안전한’ 단어를 고르는 경향이 있어, 출력의 perplexity가 낮습니다. 사람 글은 의외의 단어 선택이 많아 보통 더 높습니다.

문장 길이와 복잡도의 변화 폭입니다. 사람은 긴 문장 뒤에 짧은 문장을 두는 등 들쭉날쭉하지만, AI는 더 균일한 경향이 있습니다. 낮은 burstiness 역시 ‘AI 쪽’으로 점수를 밀어냅니다.

최신 탐지기는 사람·AI 글 대량 표본으로 분류기를 학습시켜, 공식 하나로 표현하기 어려운 미세한 ‘지문’까지 잡습니다. 하지만 학습 범위를 벗어난 새 모델·문체·비원어민 글에서는 양쪽 모두 오류가 납니다.

사람 글과 AI 글은 통계적으로 겹칩니다. 겹치는 한 어떤 기준선도 둘을 깔끔히 가르지 못하고, 오탐(억울한 사람)과 미탐(놓친 AI)을 맞바꿀 뿐입니다. 그래서 ‘100% 정확한 AI 탐지’는 존재하지 않습니다. 한계를 염두에 두고 직접 검사해보세요.

텍스트를 붙여넣으면 0–100 AI 점수와 AI로 의심되는 문장을 확인할 수 있습니다.

perplexity가 뭔가요?

단어 선택이 얼마나 예측 가능한지를 나타냅니다. AI 글은 보통 perplexity가 낮아 기계 신호로 해석됩니다.

왜 AI 탐지는 100%가 안 되나요?

사람과 AI 글의 통계적 특성이 겹치기 때문입니다. 탐지기는 오탐과 미탐을 맞바꿀 뿐, 둘 다 없앨 수는 없습니다.

⚠️ AI 탐지 점수는 확률적 신호이며 100% 정확하지 않습니다. 사람이 쓴 글을 AI로 오판할 수 있습니다. 부정행위·학사 평가의 단독 근거로 점수를 사용하지 마세요.