
언어모델
BERTBERT
BERT(Bidirectional Encoder Representations from Transformers)는 2018년 Google이 발표한 양방향 Transformer 사전 학습 언어 모델이다. 문맥을 양방향으로 이해해 자연어 이해(NLU) 태스크에서 획기적인 성능을 달성했다.
BERT의 혁신
사전 학습 태스크
| 태스크 | 설명 |
|---|---|
| MLM (Masked Language Model) | 15% 토큰을 [MASK]로 가리고 예측 |
| NSP (Next Sentence Prediction) | 두 문장이 연속인지 예측 |
Fine-Tuning 예시
관련 개념
- •Transformer — BERT의 기반 아키텍처
- •GPT — 같은 Transformer 계열의 생성 모델
- •파인튜닝 — BERT를 특정 태스크에 적용
- •임베딩 — BERT의 텍스트 표현
참고문헌
- •Devlin et al. (2018). BERT: Pre-training of Deep Bidirectional Transformers