
생성형 AI
Diffusion Model확산 모델
확산 모델(Diffusion Model)은 노이즈를 점진적으로 제거해 이미지를 생성하는 딥러닝 모델이다. Stable Diffusion, DALL-E 3, Midjourney의 기반 기술로 현재 이미지 생성 AI의 표준이다.
동작 원리
텍스트-이미지 생성
GAN vs 확산 모델
| 항목 | GAN | 확산 모델 |
|---|---|---|
| 학습 안정성 | 불안정 | 안정적 |
| 다양성 | 낮음 (mode collapse) | 높음 |
| 품질 | 좋음 | 더 좋음 |
| 속도 | 빠름 | 느림 (다단계) |
관련 개념
- •GAN — 이전 세대 이미지 생성 모델
- •딥러닝 — 확산 모델의 기반
- •임베딩 — 텍스트 프롬프트 임베딩
참고문헌
- •Ho et al. (2020). Denoising Diffusion Probabilistic Models
- •Rombach et al. (2022). High-Resolution Image Synthesis with Latent Diffusion Models