当前位置: 主页 > 科技 >

NVIDIA Ampere GPU 架构公开课下周直播!NVIDIA中国区工程及解决方案总监赖俊杰博士主讲 | 直播预告

时间:2020-05-21来源:互联网 作者:编辑 点击:
原标题:NVIDIAAmpereGPU架构公开课下周直播!NVIDIA中国区工程及解决方案总监赖俊杰博士主讲|直播预告 在5月14日刚刚结束的GTC2020发布会上,NVIDIA发布了新一代GPU架构“Ampere(安培)”,

原标题:NVIDIAAmpereGPU架构公开课下周直播!NVIDIA中国区工程及解决方案总监赖俊杰博士主讲|直播预告

在5月14日刚刚结束的GTC2020发布会上,NVIDIA发布了新一代GPU架构“Ampere(安培)”,并推出首款基于Ampere架构的GPU——NVIDIAA100。相比上一代Volta架构V100GPU,NVIDIAA100GPU实现了5大技术突破:

1、Ampere架构,也是A100的核心,采用7nm工艺,包含540亿个晶体管,面积达到826mm²,是目前最大的7nm处理器;

2、第三代张量核心(TensorCore),计算更加灵活、速度更快、使用更容易。其功能经过扩展后加入了专为AI开发的全新TF32精度,无需更改代码,可将AI计算速度提升至上一代的20倍。此外,张量核现已支持FP64,为HPC应用提供了比上一代多2.5倍的算力。

3、多实例GPU(MIG),可以将一个A100GPU分割成多达7个独立的GPU实例,从而为不同任务提供灵活的算力支持,并确保GPU资源得到充分的利用;

4、第三代NVLink互联技术,使得GPU与GPU之间的互联带宽达到600GB/s,是PCIe4.0带宽的10倍,能够大幅提升服务器的扩展性能;

5、结构稀疏性,A100中的TensorCore可为稀疏模型提供高达2倍的性能提升。虽然稀疏化功能对AI推理更为有益,但它也可用于改善模型训练的性能。

通过以上不同技术维度的升级组合,NVIDIAA100GPU实现了迄今为止最大的性能飞跃,训练峰值算力达到312TFLOPS,AI推理峰值算力达到1248TOPS,将AI训练和推理性能提高到上一代的20倍。Ampere架构的发布也引发了大家的广泛关注。

为此,智东西公开课联合NVIDIA推出的AmpereGPU架构公开课,独家解密NVIDIA新一代GPU架构“Ampere(安培)”。

5月26日晚7点,AmpereGPU架构公开课将正式开讲,由NVIDIA中国区工程及解决方案总监赖俊杰博士主讲,主题为《面向HPC及AI的巨大飞跃,NVIDIA全新AmpereGPU架构深度解析》。

赖俊杰博士将围绕Ampere架构、新一代TensorCore、多实例GPU、结构化稀疏性和第三代NVLink,NVSwitch技术,以及基于A100GPU打造的第三代AI系统DGXA100进行全方位解读。

课程时间

时间:5月26日晚7点

地点:智东西公开课小程序

课程详情

主题:面向HPC及AI的巨大飞跃,NVIDIA全新AmpereGPU架构深度解析

提纲:

1、NVIDIAAmpereGPU架构总览

2、第三代TensorCore,及TF32应用深入解析

3、多实例GPU(Multi-InstanceGPU)技术及应用场景

4、通过结构化稀疏(StructualSparsity)进一步加速神经网络计算

5、第三代NVLink,NVSwitch及DGXA100解读

讲师:

赖俊杰博士,现任NVIDIA中国区工程及解决方案总监。赖博士在清华大学电子工程系取得本科及硕士学位,于法国INRIA获得博士学位。博士期间的主要的研究方向包括GPU架构研究,及GPU性能分析模型。在并行程序的性能分析,及性能优化领域有丰富的经验。现在工作的重点是带领团队协助NVIDIA的关键用户完成机器学习应用的工程落地,以及尝试利用机器学习的最新技术,去解决计算机视觉,语音,游戏等行业应用中遇到的实际问题。

报名方式

添加智东西公开课小助手芒芒(ID:zhidxclass005)报名,添加时请备注“姓名-公司/学校-职位/专业”,因报名人数过多,优先通过备注者。

顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
推荐内容