banner

블로그

Sep 02, 2023

MGX: Nvidia가 멀티를 표준화하다

더 많은 MGX 사양으로 업데이트되었습니다:컴퓨팅 엔진 제조업체가 마더보드와 시스템 설계도 함께 수행할 때마다 마더보드를 만들고(수십 군데가 있음) 시스템 설계를 만드는 회사(원래 설계 제조업체와 원본 – 약간 긴장되기도 하고 안도하기도 함) 구성 요소의 표준화는 수행할 작업이 적다는 것을 의미하지만 동시에 비용을 청구할 비용도 줄어듭니다.

MGX 다세대 서버 플랫폼 설계를 이번 주 대만에서 열린 Computex 무역 박람회에서 발표했습니다. 대만은 전 세계 부품 및 시스템 제조의 주요 중심지 중 하나이자 컴퓨팅 엔진 제조 및 조립의 확실한 중심지 중 하나입니다. 는 자신과 전 세계 OEM 및 ODM의 삶을 더 쉽게 만들고 자신과 그들 모두에게 더 나은 이익을 제공하기를 희망합니다.

Nvidia는 "Pascal" P100 GPU 가속기를 기반으로 하는 DGX-1 시스템이 2016년 4월 출시된 이후 자체 서버를 만들어 왔습니다. Nvidia는 출시 기간을 단축하고 구성 요소 및 마더보드 설계에 피드백 루프를 생성하기 위해 이를 수행하기로 결정했습니다. Nvidia가 대규모 AI 워크로드를 실행하기 위해 자체 슈퍼컴퓨터를 구축해야 한다는 사실(OEM이나 ODM이 수행하는 것보다 저렴함)도 결정에 기여한 요인이었습니다. 당시 엔비디아가 제조할 수 있었던 대부분의 파스칼 GPU는 하이퍼스케일러와 클라우드 빌더는 물론 소수의 HPC 센터로 배송되고 있었고, DGX-1은 연구원과 과학자들이 얻을 수 있도록 엔비디아가 우선적으로 판매하고 있었습니다. 이러한 GPU 가속 시스템을 손에 넣으세요. DGX-1 시스템이 두 달 전에 발표된 "Volta" V100 GPU 가속기로 업데이트된 2017년 5월에도 마찬가지였습니다. DGX-A100 시스템은 2020년 5월에 "Ampere" A100 GPU를 사용하여 출시되었으며, 물론 NVLink 스위치 패브릭으로 훨씬 더 확장되는 DGX-H100 디자인은 "Hopper" H100 GPU 가속기와 동시에 출시되었습니다. 작년에 DGX-GH200 시스템의 하이브리드 CPU-GPU 설계로 이번 주에 업데이트되었습니다.

최신 DGX-H100 및 DGX-GH200 시스템에 사용되는 H100 SXM5 또는 NVSwitch 3 ASIC을 구입할 수 없습니다. CPU, GPU 및 NVSwitch 상호 연결용 시스템 보드는 제조 및 테스트된 모든 구성 요소와 함께 하나의 단위로 하이퍼스케일러, 클라우드 빌더 및 해당 ODM 공급업체에 판매되며 사전 조립된 구성 요소로 OEM에도 판매됩니다. 그들의 시스템에. 자체 시스템을 구축하려는 경우 Nvidia에서 GPU 가속기의 PCI-Express 버전이나 Quantum InfiniBand 또는 Spectrum 이더넷 ASIC을 구입할 수 있지만 NVSwitch 메모리 패브릭에서 실행되는 고급 제품의 경우 사전 조립된 이러한 제품을 가져와야 합니다. HGX라고 불리는 컴포넌트입니다.

HGX/DGX를 사용하여 시스템의 내부 구성 요소를 어느 정도 표준화한 Nvidia는 이제 이러한 구성 요소를 둘러싸는 셸을 표준화하여 모든 ODM 및 OEM의 출시 시간을 단축하고 결과 시스템이 미래의 아키텍처 변경 사항이 무엇이든 간에 최대한 현장에서 업그레이드할 수 있습니다.

간단히 말해서 이것이 MGX의 노력의 전부입니다.

지난 5월 Nvidia가 프로토타입 HGX Grace 및 HGX Grace-Hopper 시스템 디자인을 공개했을 때 초기 MGX 디자인이 어떤 모습인지 조금 맛보았습니다. 이는 단순한 시스템 보드가 아니라 완전한 랙 장착형 서버 설계였습니다.

MGX 표준화 노력은 DGX/HGX 데이터 센터 컴퓨팅 플랫폼, OVX 메타버스 호스팅 플랫폼, CGX 클라우드 그래픽 및 게임 플랫폼에 걸쳐 이루어질 것이며 Nvidia가 Grace CPU와 다양한 GPU 가속기가 이 세 가지 철 라인을 위해 구성될 것이라고 말한 방법은 다음과 같습니다. :

이번 주 Computex에서 선보인 MGX 디자인은 다음과 같습니다.

왼쪽에 있는 것은 4개의 GPU 가속기와 쌍을 이루는 Grace-Grace 슈퍼칩입니다. 중앙의 시스템에는 X86 CPU 2개, ConnectX 네트워크 인터페이스 2개, GPU 가속기 8개가 있고, 오른쪽 시스템에는 수냉식 컴퓨팅 엔진(Grace-Hopper 슈퍼칩으로 추측됨) 한 쌍과 네트워크 인터페이스 카드 2개가 있습니다.

공유하다