GPT (Generative Pre-trained Transformer) - 인공지능 > 언어모델 | AI Insight Note

GPT(Generative Pre-trained Transformer)는 OpenAI가 개발한 Transformer 디코더 기반 언어 생성 모델이다. 다음 토큰 예측으로 사전 학습하며, ChatGPT의 기반 모델로 생성형 AI 혁명을 이끌었다.

GPT 버전 발전

버전	파라미터	특징
GPT-1 (2018)	117M	Transformer 기반 언어 모델
GPT-2 (2019)	1.5B	제로샷 학습 능력
GPT-3 (2020)	175B	퓨샷 학습, In-context Learning
GPT-4 (2023)	~1T	멀티모달, 추론 능력 대폭 향상

BERT vs GPT

항목	BERT	GPT
방향성	양방향 (인코더)	단방향 (디코더)
특기	이해 (분류, NER)	생성 (텍스트, 코드)
학습	Masked LM	다음 토큰 예측

API 사용 예시

python

from openai import OpenAI

client = OpenAI(api_key="your-api-key")

response = client.chat.completions.create(
    model="gpt-4",
    messages=[
        {"role": "system", "content": "당신은 친절한 AI 어시스턴트입니다."},
        {"role": "user", "content": "Python에서 Quick Sort를 구현해주세요."}
    ],
    temperature=0.7
)
print(response.choices[0].message.content)

참고문헌

•Radford et al. (2018). Improving Language Understanding by Generative Pre-Training
•Brown et al. (2020). Language Models are Few-Shot Learners

GPT (Generative Pre-trained Transformer)GPT

GPT 버전 발전

BERT vs GPT

API 사용 예시

관련 개념

참고문헌

관련 노트

프론티어 AI 모델Frontier AI Models

에이전틱 AIAgentic AI

AutoGPTAutoGPT