실행 루프로 작동하는 자율 에이전트, 기업 데이터 통합 병목 해소

LLM이 텍스트를 출력하는 대신 코드를 직접 실행·검증·수정하는 '자율 코딩 에이전트' 아키텍처가 기업 데이터 통합의 반복적 인계 문제를 구조적으로 압축한다. DIA 시스템은 7개 SQL 벤치마크 전부에서 최고 성능을 기록했으며, 이미 엔터프라이즈 프로덕션에 배포된 상태다.

기업 데이터 파이프라인에는 오랫동안 해결되지 않은 구조적 병목이 있다. 데이터 오너, 데이터 엔지니어, 분석가 사이에서 반복되는 인계(handoff) 과정은 느릴 뿐 아니라 맥락을 잃는다. 데이터 오너가 알고 있는 비즈니스 의미는 엔지니어의 스키마 설계로 변환되고, 다시 분석가의 쿼리 로직으로 번역된다. 각 단계마다 해석이 달라지고, 같은 확인 작업이 다른 사람의 손으로 반복된다. arXiv에 최근 게재된 논문 "Data Intelligence Agents(DIA)"는 이 문제를 도구의 문제가 아닌 아키텍처의 문제로 규정하고 정면으로 달려든다.

텍스트를 출력하는 것과 코드를 실행하는 것의 차이

이 논문의 핵심 아이디어는 단순하지만 강력하다. 에이전트가 "무엇을 해야 한다"는 텍스트를 생성하는 데서 그치지 않고, 실제로 코드를 생성하고 실행하며, 오류가 발생하면 스스로 수정하는 루프를 돌린다. 연구팀은 이를 '자율 코딩 에이전트(Autonomous Coding Agent, ACA)'를 1등 추상화(first-class abstraction)로 삼는다고 표현한다.

DIA 시스템은 세 개의 에이전트로 구성된다. 데이터 인터프리터(Data Interpreter)는 원천 데이터의 의미와 구조를 파악하고, 스키마 크리에이터(Schema Creator)는 그 이해를 바탕으로 정규화된 스키마를 설계하며, 쿼리 제너레이터(Query Generator)는 자연어 질문을 SQL로 변환한다. 세 에이전트는 공유 메모리(shared memory)를 통해 과거 경험을 재사용한다. 같은 실수를 반복하지 않도록 성공적인 패턴을 기억했다가 유사한 상황에 적용하는 것이다.

텍스트 생성 패러다임과의 차이는 단순한 구현 세부사항이 아니다. 텍스트를 출력하는 LLM은 자신이 틀렸는지 알 방법이 없다. 코드를 실행하는 ACA는 오류 메시지라는 즉각적인 피드백을 받고, 그것을 다음 시도의 입력으로 삼는다. 이 실행 기반(execution-grounded) 루프가 아키텍처의 근본적인 강점이다.

7개 벤치마크, 4개 SQL 방언, 그리고 프로덕션 배포

연구팀은 쿼리 제너레이터를 완전 자율 모드로 평가했다. 네 가지 작업 범주에 걸친 일곱 개의 SQL 벤치마크, 네 가지 SQL 방언(dialect)을 대상으로 했으며, 모든 벤치마크에서 현재까지 발표된 최고 성능과 동등하거나 그것을 능가하는 결과를 얻었다. 이 사실이 갖는 의미는 단순한 정확도 수치를 넘어선다.

SQL 벤치마크는 데이터베이스마다, 업무 도메인마다 특성이 크게 다르다. 특정 벤치마크에 최적화된 모델이 다른 벤치마크에서 급격히 성능이 떨어지는 현상은 이 분야에서 흔하다. DIA가 일곱 개 전부에서 최고 수준을 기록했다는 것은, 아키텍처가 특정 데이터 분포나 SQL 문법에 과적합되지 않았음을 보여준다. 연구팀이 강조하듯, 적응에 필요한 변경은 자연어 지시(instruction) 수준에만 국한된다. 새로운 데이터베이스 방언을 지원하려면 모델을 재학습하거나 새 로직을 짜는 것이 아니라 프롬프트를 바꾸면 된다.

더 중요한 맥락은 이 시스템이 실제 기업 고객을 대상으로 프로덕션에 배포되어 있다는 점이다. 학술 논문에서 흔히 접하는 프로토타입이나 소규모 실험이 아니라, 실제 운영 환경에서 검증된 시스템이다. 벤치마크 성능과 운영 신뢰성 사이의 간극은 응용 AI 연구의 오랜 난제였는데, 이 연구는 그 간극을 어느 정도 좁혔음을 시사한다.

데이터 인텔리전스의 미래 문법

DIA가 제시하는 방향이 흥미로운 이유는 개별 에이전트의 성능 때문만이 아니다. 이 논문은 엔터프라이즈 데이터 작업의 전체 워크플로를 에이전트 시스템으로 재구성하는 방식을 구체적으로 보여준다는 점에서 의미가 있다.

공유 메모리 설계는 개별 쿼리를 독립적으로 처리하는 것이 아니라, 조직 전체의 데이터 지식이 축적되고 재사용될 수 있는 구조를 만든다. 에이전트가 도메인 전문가의 검토를 위해 각 결과물을 명시적으로 노출하는 설계 역시 주목할 만하다. 완전 자동화가 목표가 아니라, 인간과 에이전트 사이의 협업 지점을 잘 정의하는 것이 목표다.

인간의 역할이 줄어드는 것이 아니라 변화하는 것이다. 데이터 엔지니어는 더 이상 SQL을 한 줄씩 짤 필요가 없지만, 에이전트가 생성한 스키마와 쿼리를 검토하고 비즈니스 맥락에서 판단하는 역할은 여전히 남는다. DIA는 이 방향의 실용적인 구현 사례이며, 그 실용성이 벤치마크 수치보다 더 설득력 있는 증거다.