행동만 관찰해 정책 코드를 복원하다, 역공학을 측정 가능한 추론 문제로 | AI Insight Note