AI · Web3 · Tech trends and insights at a glance
AI · Web3 · Tech trends and insights at a glance
by Liminal·P
2026.06.07원문 논문 ↗
Operation-Guided Progressive Human-to-AI Text Transformation Benchmark for Multi-Granularity AI-Text Detection
Sondos Mahmoud Bsharat, Jiacheng Liu, Xiaohan Zhao, Tianjun Yao, Xinyi Shang, Yi Tang
발행일: 2026.06.04
AI 글쓰기 보조 도구가 일상화되면서 '완전한 인간 저작물'과 '완전한 AI 생성물'의 경계는 급속히 흐려지고 있다. OpAI-Bench 연구팀은 인간과 AI가 단계적으로 공동 편집한 텍스트를 분석한 결과, 혼합 저작권 중간 단계의 문서가 완전 인간 저작물은 물론 고도로 AI화된 텍스트보다도 탐지하기 더 어렵다는 역설적 패턴을 발견했다. 이는 현재 AI 탐지 기술의 근본적 전제를 뒤흔드는 발견이다.
글쓰기 보조 도구가 일상이 된 지금, "이 글은 AI가 썼는가, 인간이 썼는가"라는 질문은 점점 더 단순한 답을 허용하지 않는다. 현실의 글쓰기는 대부분 중간 어딘가에 있다. 초안을 사람이 쓰고 AI가 다듬거나, AI가 제안한 문장을 사람이 수정하거나, 두 주체가 번갈아 개입하는 방식이 이미 보편화되었다. 그런데 기존의 AI 텍스트 탐지 연구는 이 현실을 외면해 왔다. 대부분의 벤치마크는 '완전히 인간이 쓴 글'과 '완전히 AI가 쓴 글'이라는 극단만을 비교하며, 그 사이의 복잡한 스펙트럼을 체계적으로 다루지 않았다.
VILA-Lab 연구팀이 발표한 OpAI-Bench는 이 공백을 정면으로 겨냥한다. 인간이 작성한 원본 문서에서 출발하여, 미리 정의된 AI 커버리지 수준과 다섯 가지 대표적인 AI 편집 작업을 거치며 아홉 단계의 순차적 개정본을 구성한다. 문서 전체, 문장, 토큰, 스팬이라는 다층적 단위에서 저작권 출처를 추적하면서 탐지 모델이 언제, 어떻게 AI의 흔적을 감지하는지를 통제된 환경에서 분석할 수 있도록 설계되었다.
기존 AI 탐지 연구는 암묵적으로 하나의 전제를 공유했다. AI가 쓴 비중이 높아질수록 탐지가 용이해진다는 것이다. 이 전제는 직관적으로 타당해 보인다. 그런데 OpAI-Bench의 실험 결과는 이 상식을 정면으로 뒤집는다. 부분적으로 AI가 편집하고 나머지는 여전히 인간의 문장이 남아 있는 혼합 저작권 텍스트는, 완전히 인간이 쓴 문서는 물론이고 AI가 대부분을 처리한 문서보다도 탐지하기 더 어렵다는 사실이 드러났다.
이른바 비단조적 탐지 패턴이다. AI 개입 비율이 증가한다고 해서 탐지 정확도가 단순히 비례하여 높아지지 않는다. 오히려 중간 구간에서 탐지 성능이 급격히 저하되는 구간이 나타난다. 이는 현재 탐지 시스템이 AI 특유의 어휘나 문체를 패턴 매칭 방식으로 포착하는 경향이 있기 때문이다. 인간의 원본 문장이 AI가 다듬은 문장 사이에 섞여 있을 때 신호는 희석되고 탐지기는 혼란을 겪는다. 완전히 AI가 생성한 텍스트는 오히려 일관된 스타일 패턴 덕분에 더 쉽게 식별되는 역설이 성립하는 것이다.
OpAI-Bench가 드러낸 또 다른 핵심 발견은 AI 개입 비율 외에도 편집 방식 자체가 탐지 가능성에 결정적으로 영향을 미친다는 점이다. 연구팀은 문장 교체, 삽입, 삭제, 재구성, 요약 등 다섯 가지 AI 편집 작업을 구분하여 각각의 영향을 분석했다. 같은 비율로 AI가 개입했더라도 어떤 방식으로 편집했느냐에 따라 탐지 결과가 크게 달라진다. 문장 전체를 교체한 경우와 기존 문장을 조금씩 다듬은 경우는 최종 AI 커버리지가 동일해도 탐지기의 반응이 다르다.
누적 편집 이력 또한 중요한 변수로 작용한다. 여러 라운드에 걸쳐 점진적으로 AI가 개입한 텍스트는 동일한 최종 AI 커버리지를 단번에 달성한 텍스트와 탐지 난이도가 다르다. 이전 단계의 편집이 다음 단계에서의 탐지에 영향을 미치는 역사 의존적 구조가 존재하는 것이다. 도메인 또한 무시할 수 없다. 학술 논문, 뉴스 기사, 소셜 미디어 게시물, 문학적 산문 등 텍스트의 성격에 따라 AI 탐지기의 민감도가 달라지며, 도메인별로 탐지 효율이 비대칭적으로 분포한다. 벤치마크는 문서 수준에서 8개, 문장 수준에서 7개, 토큰·스팬 수준에서 2개의 탐지기를 평가 대상으로 삼아 다층적 비교를 가능하게 했다.
OpAI-Bench가 던지는 함의는 탐지 기술의 한계에만 국한되지 않는다. 더 근본적인 질문을 제기한다. 우리는 무엇을 탐지하려 하는가. AI가 편집에 일부 관여한 텍스트를 'AI 생성물'로 분류해야 하는가, 아니면 저작권의 주도권이 어디에 있느냐를 기준으로 삼아야 하는가. 학술 윤리, 언론 투명성, 저작권법 모두 이 질문에 서로 다른 답을 요구할 수 있다.
연구팀은 OpAI-Bench가 탐지기 개발을 위한 통제된 테스트베드를 제공함으로써, 'AI 보조 글쓰기가 언제, 어떻게 탐지 가능해지는지'에 대한 실증적 이해를 심화할 수 있다고 주장한다. 이 방향의 연구가 축적될수록, 탐지 기술은 단순한 이진 분류에서 벗어나 저작권의 스펙트럼을 섬세하게 포착하는 도구로 진화해야 한다는 과제가 더욱 선명해진다. 코드와 데이터는 공개되어 있으며, 혼합 저작권 시대의 AI 탐지 연구에 실질적인 출발점이 될 것으로 보인다.