软硬协同战全场英伟达再现即时AI实力

2024-10-03 13:27:00
miadmin
原创
58

MLPerf由图灵奖得主大卫·帕特森(David Patterson)结合谷歌、斯坦福、哈佛大学等单元协同创制, 每年MLPerf会按期举办AI操练和推理新测试,并增添代外 AI 最优秀本领的新作事负载。

正在最新一轮的基准测试MLPerf 1.0中,MLPerf Training v1.0由八种分别的作事负载构成,涵盖普及的行使场景,席卷视觉、言语、推选和深化进修。

MLPerf Inference v1.0 正在七种分别类型的神经搜集中测试了七种分别的负载,个中三个用于筹划机视觉,一个用于推选编制,两个用于言语打点,一个用于医学成像。

这是英伟达生态编制第四次出席MLPerf的操练测试,除英伟达之外,戴尔、富士通、技嘉、海潮、联思、宁畅、超微一道插足了本轮测试,运用NVIDIA A100 Tensor Core GPU,推出12套商用编制,占完全提交作品的四分之三。

MLPerf 1.0基准测试基于当今最常用的AI作事负载和场景,与之前比拟,增补了聚会识别RNN-T和医学图像划分UNet-3D两种。其余六种是自然言语打点搜集BERT、深度进修推选模子DLRM、对象检测搜集SSD和Mask R-CNN、深化进修搜集MiniGo和用于图像分类的ResNet-50。

正在这八项测试中,A100 GPU均创记载。英伟达数据中央筹划产物办理高级总监Paresh Kharya分享了DGX SuperPOD和DGX A100正在测试中的外示。

操练基准测试聚焦用户最合注的题目,好比操练一个全新AI模子所需的韶华,正在最新一轮MLPerf基准测试结果中,每一项模子操练中英伟达AI平台都可正在最短的韶华内竣事,并正在商用提交种别的完全八项基准测试中创下了功能记载。

从最新的TOP500排名来看,Selene是宇宙上最速的贸易人工智能超等筹划机之一,Selene是英伟达6位工程师仅花费约25天即搭筑竣事的,守旧超算编制正在最理思情状下也需求数十名工程师花费数月韶华竣事,可能说杀青了一个不小的工程行状,这与NVIDIA DGX SuperPOD架构超强的高可扩展的模块化计划特性分不开。

另外,正在搜集彼此连构方面,Selene采用了200G HDR的InfiniBand本领,同时将280个节点采用胖树拓扑互连,联络NVIDIA最新的节点间通讯加快本领SHARPTM2.0,让Selene不妨正在保护足够搜集带宽的同时,消重节点间通讯延时,提升大范围运算打点恶果。

而看待需求最高功能的大范围作事,这正好是英伟达的上风所正在,英伟达创记载地纠集相联了4096个GPU的资源,英伟达及其互助伙伴正在八项精准测试中都创下记载。

MLPerf测试结果再次出现了英伟达举动本领新贵的上风,正在过去两年半的韶华内,英伟达将功能提升了众达6.5倍,满盈外明了席卷GPU、编制和软件正在内的全栈式NVIDIA平台的势力。

与昨年比拟,基于英伟达DGX SuperPOD和DGX A100的编制测试外示均有较大提拔。正在DLRM(深度进修推选模子)测试中,基于DGX SuperPOD编制得分更是提拔了3.5倍。

从硬件来看,此次设备的英伟达DGX A100 GPU,是第二次插足MLPerf测试,A100是Selene优异功能的保护,举动英伟达第八代数据中央GPU,采用Ampere架构,杀青了若干硬目标(整个可参睹之前E企斟酌院理会:NVIDIA安培GPU:从TOP500走向云智行使)。

英伟达不但正在硬件层面供应更强的才具,软件算法和数据布局革新也供应了更高的恶果,可谓根底举措换代的旁边手,运用AI优化本领,A100 GPU不妨逛刃足够的应对众用户、分别范围AI负载看待GPU硬件资源的需求。

Selene的软件境遇苛重基于NVIDIA的NGC容器化资源库来杀青,它包括众品种面向深度进修和高功能筹划的GPU优化软件东西,撑持全栈局限内的功能优化,同时撑持容器化的搀和编程境遇,如许的一套NVIDIA可控的软硬件境遇可认为高功能筹划和AI行使的用户供应便当的编程开荒境遇

个中,CUDA Graphs,是英伟达新的异步职业图像(Task-Graph)编程模子,可能提拔内核启动和实行的恶果。另外,大范围测试中运用的是NVIDIA SHARP。该软件不妨正在搜集相易机内整合众项通讯作事,从而裁减搜集流量和恭候CPU的韶华。

CUDA Graphs和SHARP的联络,使数据中央不妨运用有史以还最众的GPU举办操练。正在诸如自然言语打点等许众规模,跟着AI模子参数增补到数十亿的量级,如许的组合恰能供应所需的强健才具。

英伟达针对AI行使的优化本领,使得A100 GPU不妨逛刃足够的应对众用户、分别范围AI负载看待GPU硬件资源的需求,也鞭策了HPC和AI的调解,同时有力促进了大范围分散式AI行使的斟酌。

同时,异构筹划和AI行使,英伟达的本领门道踩对了本领的繁荣脉搏,也结婚了时间的行使需求。此次插足测试的生态伙伴选用的是包括从初学级角落效劳器,到可容纳数千个GPU的AI超等筹划机。席卷插足最新基准测试的七家互助伙伴正在内,共有二十众家云效劳供应商和OEM厂商的产物或采用了NVIDIA A100 GPU,或策画为正在线实例、效劳器采用NVIDIA A100 GPU,席卷近40款NVIDIA认证编制。

而正在英伟达生态伙伴的协同辛勤下,可为客户供应百般安置模子遴选,供应业内最高的性价比——从按分钟出租的实例,到当地效劳器和托管效劳。

好比德邦癌症斟酌中央将3DUNet等改进本领引入医疗市集。举动行业法式的MLPerf基准测试供应了合系的功能数据,不妨助助IT机构和开荒者找到适应的处置计划,以加快特定项目和行使。”

用AI改进本领赋能各行各业,英伟达正正在从硬件到软件一贯加持企业打制强健的AI根底举措;而基于与生态伙伴的结合改进,企业依据场景适配产物计划,鞭策本身交易繁荣,推进交易智能升级。