AMD 发表全球首款 7奈米製程资料中心GPU

AMD 发表AMD Radeon Instinct MI60与MI50加速器,为全球首款7奈米製程资料中心GPU,旨在满足新一代深度学习、高效能运算、云端运算以及渲染等应用所需的运算效能需求。研究人员、科学家以及开发者等运用AMD Radeon Instinct加速器解决各种严峻与瞩目的挑战,包括大规模模拟、气候变迁、计算生物学与疾病预防等。
AMD 发表全球首款 7奈米製程资料中心GPU


AMD Radeon绘图技术事业群工程部全球资深副总裁David Wang表示,传统GPU架构限制了IT管理者有效处理对现代云端资料中心的工作负载进行庞大资料集的持续演进与分析需求。新款AMD Radeon Instinct加速器结合世界级效能以及灵活架构,加上强大的软体平台以及业界最顶尖的ROCm开放软体产业体系,不但提供业界需要的关键元件,也解决了现今与未来最艰鉅的云端运算挑战。

AMD Radeon Instinct MI60与MI50加速器拥有灵活的混合精度运算功能,搭载高效能运算单元,能够处理更多工作负载类型,如各种HPC与深度学习应用。全新AMD Radeon Instinct MI60与MI50加速器专为有效处理众多工作负载类型而设计。其应用範围涵盖训练複杂的神经网路,为资料中心与部门部署提供更高的浮点运算效能、效率以及各种新功能注1。
AMD 发表全球首款 7奈米製程资料中心GPU


AMD Radeon Instinct MI60与MI50加速器提供高速的浮点运算效能以及高达1 TB/s的超高速HBM2(第2代高频宽记忆体),也是首款支援新一代PCIeR 4.0注2互连技术的GPU,比其他x86 CPU到GPU互连技术快出高达2倍注3,并配备AMD Infinity Fabric Link GPU互连技术,让GPU对GPU的通讯比PCIeR Gen 3快出高达6倍注4。

AMD同时宣布推出用于加速运算的新版ROCm开放软体平台,支援新款加速器的各项结构功能,包括优化的深度学习作业(DLOPS)以及AMD Infinity Fabric Link GPU互连技术。专为扩充设计的ROCm让客户在开放环境中部署高效能且环保节能的异质化运算系统。


[广告]

Google TensorFlow工程部总监Rajat Monga表示,Google相信开放性资源对每位使用者都有益处。我们看到了开源机器学习技术带来的助益,也很高兴看到AMD的支持。在ROCm开放软体平台的帮助下,TensorFlow用户将能受益于GPU加速技术以及更强大的开源机器学习产业体系。

AMD Radeon Instinct MI60与MI50加速器的特色:
- 优化深度学习作业:提供灵活的混合精度FP16、FP32以及INT4/INT8运算功能,满足瞬息万变且不断演化成长的工作负载需求,包括从训练複杂的神经网路一直到对这些受训网路执行的推导。
- 全球最快双精度PCIeR2加速器注5:AMD Radeon Instinct MI60加速器是全球最快双精度PCIe 4.0加速器,提供高达7.4 TFLOPS的尖峰FP64效能注5,让各产业的科学家与研究人员更有效率地处理各种HPC应用,包括生命科学、能源、金融、汽车、航太、学术、政府机构以及国防等领域。AMD Radeon Instinct MI50提供高达6.7 TFLOPS的FP64尖峰效能注1,针对各种深度学习工作负载带来一个高效率、高性价比的解决方案,同时能在虚拟桌面基础架构(VDI)、桌面即服务(DaaS)以及各种云端环境高度重複使用。
- 高达6倍的资料传输速度:每个GPU配置2个Infinity Fabric Links,点对点传输频宽高达200 GB/s,比PCIe 3.0快达6倍注4,在巢式环形组态下支援4个GPU连结(在8 GPU的伺服器内配置2个巢结构)。
- 超高速HBM2记忆体:AMD Radeon Instinct MI60和MI50分别提供32GB及16GB的HBM2错误校正码(ECC)记忆体注6。两款GPU提供全晶片ECC与可靠、可用、可维护注7技术(RAS)。RAS可为超大规模HPC部署,提供更精準运算结果的关键技术。
- 支援安全虚拟化工作负载:AMD MxGPU技术是业界唯一硬体式GPU虚拟化解决方案,採用业界标準SR-IOV(单根I/O虚拟化)技术,使骇客难以从硬体层面发动攻击,为虚拟云端部署提供安全防护。

更新ROCm开放软体平台
AMD同时发布新版ROCm开放软体平台,设计旨在加速开发高效能且节省能源的异质化运算系统。除了支援新款Radeon Instinct加速器,ROCm 2.0版本软体还针对新DLOPS更新数学函式库,支援包括CentOS、RHEL以及Ubuntu在内的64位元Linux作业系统。ROCm也将现有元件优化,以及支援最新版本的热门深度学习框架,包括TensorFlow 1.11、 PyTorch(Caffe2)等。敬请参阅ROCm 2.0软体。

供应时程
AMD Radeon Instinct MI60加速器预计在2018年底开始向资料中心客户出货,Radeon Instinct MI50则预计在2019年第1季季末前开始供应。ROCm 2.0开放软体平台将于2018年底推出。