서비스 프로바이더 및 국가기관 위해 엔비디아 베라 루빈 및 엔비디아 블랙웰 플랫폼 탑재
멀티 테넌시, 엔비디아 미션 컨트롤지원 및 레드햇 연동 엔비디아 소프트웨어 등 신규 서비스 제공
[보안뉴스 강초희 기자] 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise, 이하 HPE)는 대규모 AI 팩토리와 슈퍼컴퓨터를 위한 HPE 기반 엔비디아 AI 컴퓨팅 포트폴리오(NVIDIA AI Computing Portfolio by HPE)의 주요 혁신사항을 발표했다.

[출처: 휴렛팩커드 엔터프라이즈]
이번 혁신은 고객이 AI를 보다 효율적으로 확장 및 배포하고, 인사이트 도출 시간을 단축할 수 있도록 지원하는 데 중점을 두었다. 엔비디아와 협력해 구축된 이번 풀스택 AI 솔루션은 컴퓨트, GPU, 네트워킹, 액체 냉각, 소프트웨어 및 서비스가 긴밀하게 통합돼 대규모 환경 및 소버린 환경에 최적화됐다.
아르곤 국립 연구소(Argonne National Laboratory), 독일 슈투트가르트 고성능 컴퓨팅 센터(HLRS), 허드슨 리버 트레이딩(HRT), 한국과학기술정보연구원(KISTI) 등 선도적인 연구기관 및 AI 지향 기업들이 혁신 가속화를 위해 HPE의 AI 인프라와 엔비디아 기반 AI 팩토리를 채택했다.
최근 연구소, 국가기관 및 대기업들은 기존의 고성능컴퓨팅(HPC) 워크로드를 강화하기 위해 AI를 빠르게 도입하는 추세다. HPE는 AI와 HPC를 통합하도록 설계된 2세대 엑사스케일급 슈퍼컴퓨팅 플랫폼인 ‘HPE 크레이 슈퍼컴퓨팅 GX5000’(HPE Cray Supercomputing GX5000)에서 다음과 같은 엔비디아 제품을 제공한다.
우선 엔비디아 베라(NVIDIA Vera) CPU 컴퓨트 블레이드 도입했다. 각 ‘HPE 크레이 슈퍼컴퓨팅 GX240 컴퓨트 블레이드’(HPE Cray Supercomputing GX240 Compute blade)는 엔비디아 베라 플랫폼에서 업계 최고 수준의 집적도를 제공하며, 한 랙당 최대 40개의 블레이드와 640개의 엔비디아 베라 CPU, 5만 6320개의 엔비디아 올림푸스(NVIDIA Olympus) Arm 호환 코어를 탑재할 수 있도록 확장 가능하다.
아울러 고성능 네트워킹 옵션을 선택할 수 있어 대규모 시스템에 최적화된 다양한 네트워킹 구성을 지원하며, 자사의 슈퍼컴퓨터를 맞춤형으로 구성할 수 있다.
트리시 담크로거(Trish Damkroger) HPE HPC 및 AI 인프라 솔루션 부문 수석부사장 겸 총괄은 “세계 최고 성능의 엑사스케일 슈퍼컴퓨터 3대를 구축한 HPE는 최첨단 AI 워크로드와 기존 HPC를 결합해 과학적 혁신을 주도하고 있다”며 “엔비디아와의 지속적인 협력을 통해 고객이 의학, 생명과학, 엔지니어링, 제조 등 다양한 분야에서 기존의 한계를 뛰어넘는 데 필요한 고성능 집적도를 확보할 수 있도록 지원하고 있다”고 밝혔다.
HPE는 업계 선도적인 슈퍼컴퓨팅 플랫폼 강화에 더해, 엔비디아 베라 루빈(NVIDIA Vera Rubin) 플랫폼과 엔비디아 블랙웰(NVIDIA Blackwell) 아키텍처를 통해 서비스 프로바이더, 국가 기관 및 대기업을 위한 ‘HPE AI 팩토리’ 포트폴리오를 더욱 확장한다.
HPE는 1조개 이상의 매개변수(Parameter)를 가진 프론티어급 모델을 위해 설계된 차세대 플래그십 AI 시스템인 HPE 기반 엔비디아 베라 루빈 NVL72(NVIDIA Vera Rubin NVL72 by HPE) 랙 스케일 시스템을 선보인다. 이 시스템은 대규모 환경에서 높은 효율성을 제공하며 HPE의 액체 냉각 통합 기술, 서비스 및 데이터센터 설계 전문성을 결합해 대규모 AI 구축을 간소화한다.
또한 ‘HPE 컴퓨트 XD700’(HPE Compute XD700)은 엔비디아 HGX 루빈 NVL8(NVIDIA HGX Rubin NVL8)을 기반으로 구축된 AI 서버로 랙당 높은 GPU 집적도를 제공해 공간, 전력 및 냉각 비용을 절감한다. AI 학습 및 추론 처리량도 높은 수준이다.
아울러 이제 모든 HPE AI 팩토리 포트폴리오 전반에서 엔비디아 RTX PRO 6000 블랙웰 서버 에디션(NVIDIA RTX PRO 6000 Blackwell Server Edition) GPU를 이용할 수 있다.
이러한 솔루션들은 대규모 AI 프로젝트를 추진하는 고객이 보다 빠르게 AI를 배포할 수 있도록 돕는 다양한 HPE 및 엔비디아의 소프트웨어와 서비스 업데이트를 통해 강화됐다.
이외에도 △HPE AI 팩토리 포트폴리오, 엔비디아 클라우드 파트너 프로그램 인증 획득 △대규모 AI 구축을 위한 멀티 테넌시(Multi-tenancy) 옵션 확장 △레드햇(Red Hat) 통합 △미션 컨트롤(Mission Control) 기반 HPE AI 팩토리(예정) 등 다양한 솔루션을 제공한다.
이 모든 솔루션은 세계 최대 규모이자 에너지 효율이 가장 뛰어난 슈퍼컴퓨터를 수십년간 구축하며 쌓아온 HPE의 데이터센터 설계 및 액체 냉각 분야 서비스와 전문성을 바탕으로 제작됐다.
크리스 매리어트(Chris Marriott) 엔비디아 엔터프라이즈 플랫폼 부문 부사장은 “기업과 국가가 AI의 잠재력을 실현하려면 대규모 모델 학습 및 고성능컴퓨팅(HPC) 워크로드를 처리할 인프라가 필수적”이라며 “HPE와 엔비디아가 공동 개발한 풀스택 AI 인프라는 가속 컴퓨팅, 고도화된 네트워킹 및 액체 냉각 기술을 결합해 대규모 및 소버린 환경에서 인사이트 도출 시간을 단축한다”고 밝혔다.
[강초희 기자(choh@boannews.com)]
<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>








.gif)





