Google Cloud Vertex AI는 ML 모델 학습, 배포, 관리를 위한 통합 플랫폼이다. AutoML, 커스텀 학습, 모델 레지스트리, 피처 스토어, MLOps 도구를 포함한다.
주요 구성 요소
| 컴포넌트 | 설명 |
|---|
| Vertex AI Workbench | Jupyter 기반 ML 개발 환경 |
| AutoML | 코드 없이 ML 모델 학습 |
| Custom Training | 커스텀 컨테이너 기반 학습 |
| Model Registry | 모델 버전 관리 |
| Feature Store | ML 피처 중앙 관리 |
| Pipelines | Kubeflow 기반 ML 파이프라인 |
| Prediction | 온라인/배치 예측 서비스 |
| Gemini API | 멀티모달 LLM API |
커스텀 학습 잡 예시
python
from google.cloud import aiplatform
aiplatform.init(project='my-project', location='us-central1')
job = aiplatform.CustomContainerTrainingJob(
display_name='my-training-job',
container_uri='gcr.io/my-project/trainer:latest',
model_serving_container_image_uri='gcr.io/my-project/serving:latest',
)
model = job.run(
dataset=dataset,
model_display_name='my-model',
machine_type='n1-standard-4',
accelerator_type='NVIDIA_TESLA_T4',
accelerator_count=1,
replica_count=1,
)
온라인 예측 엔드포인트
python
# 엔드포인트 생성 및 모델 배포
endpoint = aiplatform.Endpoint.create(display_name='my-endpoint')
model.deploy(
endpoint=endpoint,
machine_type='n1-standard-2',
min_replica_count=1,
max_replica_count=5,
)
# 예측 요청
predictions = endpoint.predict(instances=[{'feature1': 1.0, 'feature2': 2.0}])
Vertex AI vs SageMaker
| 항목 | Vertex AI | SageMaker |
|---|
| 클라우드 | GCP | AWS |
| AutoML | 내장 | Canvas |
| 파이프라인 | Kubeflow 기반 | Studio Pipelines |
| LLM | Gemini, PaLM | Bedrock |
관련 문서