본문 바로가기

좋아하는 것_매직IT/96.IT 핫이슈

ChatGPT등이 생성한 글인지 판별해주는 AI Text Classifier 공개했다고 하네요..

반응형

서두에서는 아래와 같이 말하고 있고요..
----
The AI Text Classifier is a fine-tuned GPT model that predicts how likely it is that a piece of text was generated by AI from a variety of sources, such as ChatGPT.

This classifier is available as a free tool to spark discussions on AI literacy. For more information on ChatGPT's capabilities, limitations, and considerations in educational settings, please visit our documentation.

Current limitations:
Requires a minimum of 1,000 characters, which is approximately 150 - 250 words.
The classifier isn't always accurate; it can mislabel both AI-generated and human-written text.
AI-generated text can be edited easily to evade the classifier.
The classifier is likely to get things wrong on text written by children and on text not in English, because it was primarily trained on English content written by adults.
----

해석을 간단하게 해보자면요..
----
AI Text Classifier는 ChatGPT와 같은 다양한 소스에서 AI가 텍스트 조각을 생성했을 가능성을 예측하는 미세 조정된 GPT 모델이라고 하고요.

이 분류자는 AI 문해력에 대한 토론을 촉발하는 무료 도구로 사용할 수 있다고 하네요..
그리고,교육 환경에서 ChatGPT의 기능, 제한 및 고려 사항에 대한 자세한 내용은 설명서를 참조하라고 하고요..

현재 제한 사항을 알아보니깐요..
최소 1,000자(약 150~250단어)가 필요하고요..
분류자가 항상 정확한 것은 아니라고 하네요..
그리고, AI가 생성한 텍스트와 사람이 쓴 텍스트 모두에 레이블을 잘못 지정할 수 있다고 하고요..

추가적으로 AI로 생성된 텍스트는 분류자를 피하기 위해 쉽게 편집할 수 있다고 하고요..
분류기는 주로 성인이 작성한 영어 콘텐츠에 대해 훈련되었기 때문에 어린이가 작성한 텍스트와 영어가 아닌 텍스트에서 오류를 범할 가능성도 있다고 하네요..
----

제가 한번 아래와 같이 테스트 해봤는데요..
아래는 인간이 쓴글이고요..

즉, 분류자는 텍스트가 AI 생성 가능성이 매우 낮다고 간주한다고 말하는군요...

그럼, AI가 쓴글에 대해서 알아보면요..

AI가 쓴글가지고 테스트 해보니깐요..
분류자는 텍스트를 AI 생성 가능성이 있는 것으로 간주합니다 라고 말하고 있네요..

정말로, 이제 기술력은 끝판왕 같습니다. 
요즘 뉴스도 AI가 쓴다고 하는데요.....해당 기술이 더욱 발전되면요....
뉴스에 대해서 인간이쓴글인지, AI가 쓴글인지 확인이 가능하겠군요..

그리고, 얼마전에 뉴스를 뜬 것을 봤는데요....
요즘 대학생들이 AI에서 보고서를 작성해서 제출했다는 사실을요.
해당 기술이 발전된다면, 교수님들께서 진짜 학생이 썻는지 AI가 썻는지에 대해서 판별하기 쉬워지겠군요..

주요내용을 정리하자면 아래와 같고요..

  • GPT 모델을 미세조정하여, ChatGPT 같은 AI가 생성한 글인지를 판별
  • AI literacy 토론을 위해서 무료로 제공
  • very unlikely, unlikely, unclear if it is, possibly, likely 중의 하나로 판단해줌
  • 현재 제약점
    • 최소 1000자 이상의 글자 필요(150~250단어)
    • 항상 정확하지는 않음. AI가 작성한 것인지, 사람이 작성한 것인지 mislabel 할 수 있음
    • AI로 생성된 텍스트는 Classifier를 회피하기 위해 쉽게 편집 가능
    • 어린이가 쓴 글이나, 영어가 아닌 글에 대해서는 문제가 있을 수 있음. 성인이 작성한 영어 컨텐츠로 주로 훈련한 것

좀 더 자세한 내용은 아래 웹페이지를 방문해보시길 추천드립니다. 

오늘의 블로그는 여기까지고요..
항상 믿고봐주셔서 감사합니다. 

728x90
300x250