앞 층에 용량을 몰아주는 테이퍼링, 공짜로 얻는 언어 모델 성능 향상 | AI Insight Note