버티브-엔비디아, NVIDIA GB200 NVL72 플랫폼 위한 완벽한 전원·냉각 레퍼런스 아키텍처 공동 개발

  • 박현아
  • 발행 2024-10-29 13:48
최대 7MW의 엔비디아 블랙웰 아키텍처 위한 엔드투엔드 핵심 전력 및 냉각 레퍼런스 디자인… OCP 인프라 옵션도 제공


핵심 디지털 인프라 및 연속성 솔루션 전문 기업인 버티브(Vertiv)는 고객이 기존 데이터센터 아키텍처를 인공지능(AI) 팩토리로 전환해 AI 애플리케이션을 전사적으로 활용할 수 있도록 지원하기 위해 엔비디아(NVIDIA) GB200 NVL72 플랫폼의 완전한 7MW 레퍼런스 아키텍처를 엔비디아와의 공동 개발을 통해 출시한다고 밝혔다.

이 레퍼런스 아키텍처는 엔비디아 GB200 NVL72 액체냉각 랙 스케일 플랫폼의 구축을 가속화할 것이며, 랙당 최대 132kW를 지원한다. 이 아키텍처는 인프라 설계에 대한 엔드투엔드 접근 방식을 채택하고 있어 기존 및 차세대 데이터센터의 배포 속도, 성능, 복원력, 비용, 에너지 효율, 확장성을 최적화한다.

버티브의 지오다노 알베르타치(Giordano (Gio) Albertazzi) CEO는 “현 세대 및 미래 세대의 AI 기반 데이터센터를 구현할 수 있도록 엔비디아와의 협력을 강화하게 돼 자랑스럽다”며 “핵심 전원 및 냉각 인프라 분야의 글로벌 선도기업으로서 버티브는 엔비디아 GB200 NVL72 플랫폼을 지원할 수 있는 독보적인 입지를 갖추고 있다. 버티브는 고성능 전원 및 냉각 솔루션 포트폴리오와 글로벌 비즈니스 역량을 바탕으로 고객이 보다 신속하고 효율적이며 유연하게 AI 데이터센터를 구축해 고밀도화, 동적 워크로드, 기존 설비의 개조 등과 관련한 과제를 해결하고 미래에 대비한 설계를 구현할 수 있도록 지원할 것”이라고 밝혔다.

엔비디아의 설립자 겸 CEO 젠슨 황(Jensen Huang)은 “새로운 데이터센터는 가속화된 컴퓨팅과 생성형 AI를 위해 범용 컴퓨팅 아키텍처보다 훨씬 더 복잡한 아키텍처로 구축된다”며 “버티브의 세계 최고 수준의 냉각 및 전원 기술로, 엔비디아는 컴퓨팅을 재창조하고 모든 기업과 산업에 혜택을 주는 디지털 인텔리전스를 만들어내는 새로운 AI 팩토리 산업을 구축한다는 우리의 비전을 실현할 수 있게 됐다”고 말했다.

엔비디아 블랙웰(NVIDIA Blackwell) 플랫폼에 부합하고 긴밀하게 결합된 버티브의 전원 및 냉각 인프라를 통해 이 레퍼런스 아키텍처는 신규 및 기존 데이터센터의 AI 워크로드 배포를 간소화·가속화할 뿐만 아니라 사이트 전반에 걸쳐 위험을 줄이고 표준화를 가능하게 한다. 이 아키텍처의 완전한 핵심 전원 인프라는 AI 클러스터를 데이터센터 용량 블록에 맞춰 조정함으로써 좌초 전력(stranded power)을 대폭 줄일 수 있도록 설계됐다. 수냉식과 공랭식을 결합한 하이브리드 인프라는 두 가지 접근 방식의 상호 의존적인 영향을 활용해 고밀도의 열을 효과적으로 제거한다. 또한 이 설계에는 DC 전원 선반(power shelves)과 같이 오픈 컴퓨트 프로젝트(Open Compute Project, OCP)에서 영감을 받은 시스템(옵션)에 대한 지침이 포함돼 있다.

이 레퍼런스 아키텍처는 개조 및 신규 데이터센터를 위한 Vertiv™ 360AI 포트폴리오 레퍼런스 디자인의 일부로, 고객이 AI 및 기타 고성능 컴퓨팅(high-performance computing, HPC) 애플리케이션을 위한 전원 및 냉각 통합 솔루션을 탐색할 수 있도록 설계됐다.

이번에 양사가 공동으로 개발한 NVIDIA GB200 NVL72 설계용 레퍼런스 아키텍처의 주요 이점은 다음과 같다.

· 신속한 배포 및 개조: 사전 구성된 모듈을 사용하고 공장에서 통합이 가능한 버티브 메가모드 쿨칩(VertivTM MegaModTM CoolChip)은 현장에서 구축하는 것보다 최대 50% 더 빠른 턴키 방식의 AI 핵심 인프라를 제공한다.
· 공간 절약형 전원 관리: 버티브 트리너지(Vertiv™ Trinergy™) 무정전 전원공급장치(UPS)와 버티브 에너지코어(Vertiv™ EnergyCore) 리튬 배터리 캐비닛을 비롯한 버티브의 첨단 전원 기술을 사용함으로써 기존 제품과 비교할 때 점유 면적을 최대 40% 적게 차지하면서 업계 최고의 안정성과 에너지 효율적인 전원 관리를 제공한다.
· 에너지 효율적인 냉각: 버티브 AFC(Vertiv™ AFC) 냉동기, 버티브 리버트 CW(Vertiv™ Liebert® CW) 냉수식 실내 냉각 시스템, 버티브 XDU(Vertiv™ XDU) 냉각수 분배 장치 등 액체 및 지구 온난화 지수(Global Warming Potential, GWP)가 낮은 공냉 기술을 대규모로 통합해 나사 고정식 솔루션에 비해 연간 냉각 비용을 최대 20%까지 절감할 수 있다.
· 동적 워크로드 관리: 리튬 이온 배터리와 차세대 UPS를 통한 통합 부하 평균화로 GPU 워크로드를 동적으로 관리한다.
· 설치 및 운영 서비스: 업계 선도적인 규모와 범위, 전 세계 약 4000명의 현장 서비스 엔지니어를 보유한 버티브는 개조 및 신규 구축을 위한 신뢰할 수 있는 수명주기 서비스 파트너이자 복잡한 시스템 수준의 전문 기업이다.

기업들이 전례 없이 빠른 속도로 AI를 도입함에 따라 버티브는 가속 컴퓨팅을 지원하기 위한 핵심 전원 및 냉각의 미래를 재편해 나가고 있으며, 이를 위해 AI 및 기타 가속 컴퓨팅 애플리케이션 특유의 요구 사항을 관리할 수 있는 AI 지원 인프라 구현의 가장 완벽한 핵심 디지털 인프라 포트폴리오를 공급하고 있다.

버티브와 엔비디아의 협력은 기술 공동 개발을 위한 미래 지향적인 로드맵을 설정하고 가속 컴퓨팅을 대규모로 배포할 수 있도록 지원한다. 이 레퍼런스 디자인에 대한 보다 자세한 정보는 Vertiv.com에서 확인할 수 있다.

<저작권자 ⓒ 더뉴스프라임, 무단 전재 및 재배포 금지>

박현아 기자 다른기사보기