VAST Data가 뭐고, 왜 지금 뜨나
VAST Data는 AI 워크로드를 위해 데이터를 ‘저장’하는 회사라기보다, GPU가 필요한 데이터를 ‘제때’ 받게 만드는 데이터 플랫폼에 가깝다. (키워드: 스토리지 + 데이터 파이프라인 + 운영 레이어를 한 덩어리로 묶어 “GPU 활용률”을 올리는 쪽)
이 이슈가 커진 배경은 단순하다.
- GPU는 비싸고, 대기 시간은 더 비싸다: 병목이 계산 자체에서 데이터 입출력/피딩으로 이동 중
- 스택이 길어질수록 ‘통합’이 이긴다: 레이어가 분리돼 있으면 운영/튜닝 비용이 폭증
- ROI의 언어가 바뀐다: “GPU 몇 장 더 샀나”가 아니라 처리량·활용률·지연으로 예산이 집행된다
TL;DR
GPU가 희소할수록 시장이 사는 건 ‘칩’이 아니라 칩을 쉬지 않게 만드는 데이터 레이어다. VAST Data의 밸류에이션 점프는 그 재가격의 신호다.
오늘의 신호 (3줄)
| 신호 | 의미 |
|---|---|
| VAST Data $1B 라운드, 밸류에이션 ~$30B(’23 대비 급등) | 데이터 레이어가 ‘부가 기능’이 아니라 핵심 병목 자산으로 재평가 |
| 누적 bookings >$4B, committed ARR >$500M | 인프라도 매출 품질이 있으면 메가 라운드가 성립 |
| 내러티브: “Keep GPUs fed” | ROI가 ‘새 GPU’가 아니라 **GPU 활용률(throughput)**로 설명되는 국면 |
왜 이게 중요한가 (메커니즘)
- AI 학습/추론 비용의 대부분은 결국 GPU 시간이다. GPU가 비싸질수록 **대기 시간 1%**의 가치가 커진다.
- 그래서 병목은 계산 자체가 아니라 데이터 이동/저장/피딩 파이프라인으로 이동한다.
- ‘데이터 레이어’가 스토리지 단품이 아니라 하드웨어+소프트웨어+운영(서비스)으로 묶이면서 가격결정권을 만든다.
누가 유리해지나 (2차 효과)
- 데이터 레이어/스토리지 플랫폼: ‘성능/비용’이 아니라 GPU 활용률을 올려주는 시스템 자산으로 프리미엄
- 네트워킹/인터커넥트: 데이터를 더 빨리 먹여야 하니까, 스위칭/패브릭/IO가 다음 병목 후보
- GPU 클라우드의 분기: 단순 GPU 리스는 빠르게 상품화되고, DX + 튜닝 + 운영을 묶는 쪽이 남는다
내일 체크 (트리거)
- “AI OS/데이터 플랫폼”이 실제로 하드웨어 번들 + 소프트웨어 구독으로 ARR을 쌓는지
- 신규 인프라 라운드에서 secondary 비중이 계속 커지는지(= 유동성/가격발견 방식 변화)
- 고객이 “GPU 더 사겠다”가 아니라 활용률/지연/처리량 KPI로 예산을 집행하기 시작하는지