Transformer - 인공지능 > 언어모델 | AI Insight Note

Transformer는 2017년 Google의 "Attention Is All You Need" 논문에서 제안된 셀프 어텐션 기반 딥러닝 아키텍처다. RNN을 대체해 자연어 처리의 혁명을 가져왔으며, BERT, GPT, T5 등 현대 LLM의 기반이다.

핵심 구성 요소

구성	역할
Self-Attention	시퀀스 내 각 위치 간 관계 학습
Multi-Head Attention	다양한 관점의 어텐션 병렬 수행
Feed-Forward	위치별 비선형 변환
Positional Encoding	시퀀스 순서 정보 추가
Layer Normalization	학습 안정화
Residual Connection	기울기 소실 방지

Self-Attention

"The animal didn't cross the street because it was too tired"
      ↑                                           ↑
     "it"이 "animal"을 가리킴 → 어텐션 점수 높음

Q (Query) = 내가 찾는 것
K (Key)   = 다른 위치의 표현
V (Value) = 실제 전달 내용

Attention(Q,K,V) = softmax(QK^T / √d_k) * V

RNN vs Transformer

항목	RNN/LSTM	Transformer
병렬 처리	불가 (순차적)	가능
장거리 의존성	어려움	직접 연결
학습 속도	느림	빠름

참고문헌

•Vaswani et al. (2017). Attention Is All You Need

Transformer트랜스포머

핵심 구성 요소

Self-Attention

RNN vs Transformer

관련 개념

참고문헌

관련 노트

프론티어 AI 모델Frontier AI Models

에이전틱 AIAgentic AI

AutoGPTAutoGPT