AI · Web3 · Tech trends and insights at a glance
AI · Web3 · Tech trends and insights at a glance
by Liminal·P
2026.06.12원문 논문 ↗
Agents-K1: Towards Agent-native Knowledge Orchestration
Zongsheng Cao, Bihao Zhan, Jinxin Shi, Jiong Wang, Fangchen Yu, Zhijie Zhong
발행일: 2026.06.11
AI 연구 에이전트는 그동안 논문을 초록과 인용 관계로만 단순화해 처리해왔다. Agents-K1은 논문 전체를 파싱해 개체·주장·근거·방법론 계보까지 지식 그래프로 변환하는 파이프라인으로, 246만 편의 과학 논문을 처리해 Scholar-KG를 구축했다. 과학적 추론의 깊이를 근본적으로 바꿀 수 있는 접근이다.
AI 연구 에이전트가 확산되면서 인류는 오래된 질문에 다시 맞닥뜨리고 있다. 기계가 논문을 '읽는다'는 것은 무슨 의미인가. 지금까지 대부분의 LLM 기반 연구 에이전트들은 논문의 초록을 가져오고, 인용 그래프의 엣지를 평평하게 연결하는 방식으로 과학 지식을 처리해왔다. 논문 제목이 검색 결과에 나타나고, 초록 두세 줄이 컨텍스트로 전달되며, 인용 관계는 그저 A가 B를 참조했다는 이진 정보로 환원된다.
Agents-K1이 지적하는 문제는 바로 이 지점이다. 과학 논문에는 초록에 담기지 않는 핵심 요소들이 있다. 논문 본문에서만 드러나는 개체(entity), 저자가 제시하는 주장(claim), 그 주장을 뒷받침하는 실험적 근거(evidence), 방법론이 어떤 선행 연구에서 파생됐는지를 보여주는 계보(method lineage), 그리고 도표와 수식이 담긴 멀티모달 증거들. 이런 정보를 포착하지 못한 에이전트는 논문의 표면을 훑을 뿐, 과학적 추론의 실질적 기반을 갖추지 못한다.
Agents-K1은 원시 문서를 에이전트가 직접 활용할 수 있는 과학 지식 그래프로 변환하는 엔드-투-엔드 파이프라인이다. 세 가지 구성 요소가 하나의 이론적 기반 아래 통합되어 있다.
첫째는 멀티모달 파서다. 다섯 개의 모듈로 구성된 스키마를 통해, 초록에만 의존하지 않고 논문 전체에서 개체, 멀티모달 증거(도표·수식 포함), 인용 관계, 개체 간 유형화된 관계를 추출한다. 기존 파이프라인이 논문을 납작하게 압축했다면, Agents-K1은 논문의 입체적 구조를 보존하려는 시도다. 인용 관계조차 단순한 참조가 아니라 방법론적 계승, 비판, 개선 등의 관계 유형으로 분류된다.
둘째는 40억 파라미터(4B) 정보 추출 백본이다. 이 모델은 GRPO(Group Relative Policy Optimization)와 규칙 기반 보상 신호를 결합해 훈련됐다. 강화학습 방식의 적용은 단순 지도 학습 대비 추출 정확도를 높이는 데 기여하며, 과학 문서에 특화된 정보 추출 능력을 확보한다. 어떤 문장이 주장인지 배경 서술인지, 어떤 수치가 근거인지 단순 언급인지를 모델이 판단해야 하기 때문에, 규칙 기반 보상은 인간 어노테이션만으로는 포착하기 어려운 구조적 정확도를 학습 신호로 삼는다.
셋째는 graphanything CLI, 즉 에이전트 인터페이스다. 웹 검색, 멀티모달 그래프 검색, 그리고 문서 간 순회(cross-document traversal)라는 세 가지 정보 소스를 하나의 인터페이스로 통합한다. 에이전트가 단일 논문의 지식에 머물지 않고 연결된 지식 그래프를 따라 탐색할 수 있게 되는 것이다.
이 파이프라인을 통해 연구팀은 6개 학문 분야에 걸쳐 246만 편의 과학 논문을 처리해 Scholar-KG를 구축했다. 현재 100만 편의 논문 부분집합이 공개되어 있으며, 전체 Scholar-KG는 별도 링크를 통해 접근 가능하다.
Scholar-KG가 의미 있는 이유는 단순히 규모 때문이 아니다. 지식 그래프의 구조 자체가 에이전트의 추론 방식을 바꾼다. 평평한 인용 그래프에서는 한 논문이 다른 논문을 참조했다는 사실만 알 수 있지만, Agents-K1이 구축한 그래프에서는 어떤 주장이 어떤 실험적 근거에 기반하며, 그 방법론이 어느 선행 연구에서 계승됐는지를 추적할 수 있다.
이는 멀티홉 과학적 추론(multi-hop scientific reasoning)을 가능하게 한다. 에이전트가 특정 어텐션 메커니즘의 이론적 계보를 추적하거나, 어떤 기법이 다양한 데이터셋에서 실증적으로 검증됐는지 평가하려면, 단일 논문의 초록이 아니라 여러 논문에 걸친 지식 연결망을 순회해야 한다. graphanything CLI는 바로 이 순회를 지원하는 레이어다.
Agents-K1은 또한 범용 도메인 코퍼스나 스키마 준수 데이터 합성으로 확장 가능하다고 밝힌다. 과학 논문에만 특화된 파이프라인이 아니라, 구조화된 지식 추출의 범용적 방법론을 지향하는 셈이다. 실험 결과에서는 과학 정보 추출, 지식 그래프 구축, 멀티홉 과학적 추론 세 영역 모두에서 우수한 성능이 입증됐다.
AI 에이전트가 과학 연구를 보조하는 미래에서, 에이전트가 어떤 형태의 지식을 갖추고 있는가는 핵심 질문이다. 초록 몇 줄이 아닌 논문 전체의 구조화된 지식을 에이전트에게 제공하려는 Agents-K1의 시도는, 연구 에이전트의 인식론적 기반을 한 단계 높인다는 점에서 주목할 만하다.