
딥러닝
Mamba (SSM)Mamba
Mamba는 2023년 Gu와 Dao가 제안한 State Space Model(SSM) 기반 시퀀스 모델로, Transformer의 O(N²) 어텐션 복잡도 없이 O(N) 선형 복잡도로 긴 시퀀스를 처리한다.
Mamba vs Transformer
| 항목 | Mamba | Transformer |
|---|---|---|
| 시간 복잡도 | O(N) | O(N²) |
| 공간 복잡도 | O(N) | O(N²) |
| 긴 시퀀스 | 효율적 | 비효율 |
| 선택적 상태 | 입력 의존적 (핵심) | 어텐션으로 구현 |
| 추론 속도 | RNN처럼 일정 | 길이에 따라 느려짐 |
| 병렬 학습 | 특수 알고리즘 필요 | 용이 |
SSM 수식
Python 예시 (mamba-ssm 패키지)
Mamba-2와 State Space Duality
Mamba-2(2024)는 SSM과 어텐션의 수학적 등가성(State Space Duality)을 발견하여 더욱 효율적인 하드웨어 최적화 구현을 제공한다. 멀티헤드 구조로 Transformer와의 통합이 용이해졌다.