AI · Web3 · Tech trends and insights at a glance
AI · Web3 · Tech trends and insights at a glance
by Liminal·P
2026.06.18원문 논문 ↗
Freeing the Law with LOCUS: A Local Ordinance Corpus for the United States
Denis Peskoff, Joe Barrow, Christopher Vu, Diag Davenport
발행일: 2026.06.17
미국 3만여 개 지자체의 조례는 법률 AI 연구가 사실상 손대지 못한 마지막 층위였다. LOCUS는 9,239개 도시·카운티의 조례 전문을 기계 판독 가능한 형태로 처음 공개하며, 법의 불투명성과 온정주의를 전국 규모에서 계량할 수 있는 분석 도구까지 함께 내놓는다.
미국의 법체계는 연방법, 주법, 지방 조례라는 세 층위로 구성된다. 연방대법원 판결이나 의회 입법은 오래전부터 디지털화되어 법률 AI 연구의 풍부한 토양이 되었다. 그러나 정작 미국 시민의 일상에 가장 직접적으로 닿아 있는 층위—소음 규제, 용도지역제, 동물 관리, 영업 허가, 공중보건 기준—는 기계가 읽을 수 있는 형태로 거의 존재하지 않았다. 전국 3만여 개에 달하는 시·군·구의 조례들은 민간 벤더들이 인간 사용자를 위해 구축한 플랫폼에 분산되어 있었고, 대량 접근이나 연구 목적의 활용은 사실상 봉쇄된 상태였다.
프린스턴대학교 연구진이 발표한 LOCUS(Local Ordinance Corpus for the United States)는 바로 이 공백을 정면으로 겨냥한다. 9,239개 도시·카운티의 조례 전문을 수집한 이 말뭉치는 미국 지방법의 사실상 전체를 기계 판독 가능한 형태로 처음 공개한 작업이다. 더불어 미국 3,144개 카운티 중 2,309개—인구 기준으로는 과반—를 포괄하는 카운티 조화 접근 레이어(county-harmonized access layer)를 별도로 구성해, 연구자들이 지역 간 규제를 직접 비교할 수 있는 구조화된 진입점도 마련했다.
지방 조례 수집의 가장 큰 장애물은 형식의 다양성이었다. 어떤 지자체는 최신 HTML 형식으로 조례를 제공하고, 어떤 곳은 수십 년 전 스캔한 PDF를 올려두었다. 연구진은 OCR 기술을 동원해 이 모든 형식을 처리하며 원시 말뭉치를 구축했다. 이 과정 자체가 법률 공공성의 문제를 기술적으로 해결하는 작업이다. 조례가 공개 문서로 존재하더라도 기계가 읽을 수 없다면, 연구자에게는 사실상 닫힌 자료나 다름없다.
카운티 조화 레이어는 단순 아카이빙에서 한 걸음 더 나아간다. 서로 다른 지자체의 조례를 비교 가능한 구조로 정렬해, 특정 주제에 대한 각 지역의 규제를 병렬로 분석할 수 있게 한다. 연구진은 커버리지 메타데이터도 함께 배포해 재현 가능성을 보장했고, 향후 기계 판독 가능한 지방법의 점진적 확장을 위한 인프라를 마련했다. 즉 LOCUS는 정적인 스냅샷이 아니라 계속 업데이트될 수 있는 살아있는 코퍼스로 설계되었다.
이는 법률 AI 분야에서 CourtListener나 코넬 법률정보연구소(LII)가 연방·주법 연구에 했던 역할과 정확히 같은 성격의 인프라 작업이다. 기초 자원이 갖춰져야 그 위에서 연구가 꽃핀다.
LOCUS가 단순한 데이터 수집을 넘어서는 지점은 분석 도구다. 연구진은 ModernBERT를 기반으로 한 분류기와 스코어러 집합을 훈련해, 지방 조례를 여러 차원에서 분석할 수 있는 모델을 함께 공개했다. 특히 주목할 만한 것은 이전에는 이 규모로 연구된 적 없는 두 가지 차원—불투명성(opacity)과 온정주의(paternalism)—이다.
불투명성은 법 조문이 평균 시민에게 얼마나 이해하기 어렵게 쓰였는지를 측정한다. 온정주의는 정부가 성인의 개인적 선택에 얼마나 개입하는지를 나타낸다. 이 두 차원을 9,000개 이상의 지자체에 걸쳐 체계적으로 계량화한다는 것은, 전국 규모에서 지방 규제의 민주적 정당성과 시민 접근성을 처음으로 비교 평가하는 가능성을 열어준다. 부유한 카운티의 조례가 더 읽기 쉬운가, 온정주의적 규제가 특정 지역에 편중되는가, 법적 불투명성과 시민 참여율 사이에 상관관계가 있는가—이런 질문들이 이제 데이터로 답할 수 있는 질문이 된다.
LOCUS는 이 질문들에 직접 답하지 않는다. 그러나 이 질문들을 답 가능하게 만드는 것이 코퍼스 인프라 연구가 가져야 할 적절한 야심이다. 허깅페이스에 공개된 데이터셋과 모델들이 정치학, 공공정책, 법정보학 연구자들의 손에서 어떤 분석으로 이어질지, 법률 AI의 다음 장은 연방법원이 아닌 지방의회 회의록에서 열리고 있다.