VAST Data가 뭐고, 왜 지금 뜨나

VAST Data는 AI 워크로드를 위해 데이터를 ‘저장’하는 회사라기보다, GPU가 필요한 데이터를 ‘제때’ 받게 만드는 데이터 플랫폼에 가깝다. (키워드: 스토리지 + 데이터 파이프라인 + 운영 레이어를 한 덩어리로 묶어 “GPU 활용률”을 올리는 쪽)

이 이슈가 커진 배경은 단순하다.

  • GPU는 비싸고, 대기 시간은 더 비싸다: 병목이 계산 자체에서 데이터 입출력/피딩으로 이동 중
  • 스택이 길어질수록 ‘통합’이 이긴다: 레이어가 분리돼 있으면 운영/튜닝 비용이 폭증
  • ROI의 언어가 바뀐다: “GPU 몇 장 더 샀나”가 아니라 처리량·활용률·지연으로 예산이 집행된다

TL;DR

GPU가 희소할수록 시장이 사는 건 ‘칩’이 아니라 칩을 쉬지 않게 만드는 데이터 레이어다. VAST Data의 밸류에이션 점프는 그 재가격의 신호다.

오늘의 신호 (3줄)

신호의미
VAST Data $1B 라운드, 밸류에이션 ~$30B(’23 대비 급등)데이터 레이어가 ‘부가 기능’이 아니라 핵심 병목 자산으로 재평가
누적 bookings >$4B, committed ARR >$500M인프라도 매출 품질이 있으면 메가 라운드가 성립
내러티브: “Keep GPUs fed”ROI가 ‘새 GPU’가 아니라 **GPU 활용률(throughput)**로 설명되는 국면

왜 이게 중요한가 (메커니즘)

  • AI 학습/추론 비용의 대부분은 결국 GPU 시간이다. GPU가 비싸질수록 **대기 시간 1%**의 가치가 커진다.
  • 그래서 병목은 계산 자체가 아니라 데이터 이동/저장/피딩 파이프라인으로 이동한다.
  • ‘데이터 레이어’가 스토리지 단품이 아니라 하드웨어+소프트웨어+운영(서비스)으로 묶이면서 가격결정권을 만든다.

누가 유리해지나 (2차 효과)

  • 데이터 레이어/스토리지 플랫폼: ‘성능/비용’이 아니라 GPU 활용률을 올려주는 시스템 자산으로 프리미엄
  • 네트워킹/인터커넥트: 데이터를 더 빨리 먹여야 하니까, 스위칭/패브릭/IO가 다음 병목 후보
  • GPU 클라우드의 분기: 단순 GPU 리스는 빠르게 상품화되고, DX + 튜닝 + 운영을 묶는 쪽이 남는다

내일 체크 (트리거)

  • “AI OS/데이터 플랫폼”이 실제로 하드웨어 번들 + 소프트웨어 구독으로 ARR을 쌓는지
  • 신규 인프라 라운드에서 secondary 비중이 계속 커지는지(= 유동성/가격발견 방식 변화)
  • 고객이 “GPU 더 사겠다”가 아니라 활용률/지연/처리량 KPI로 예산을 집행하기 시작하는지

Source