Nvidia推出Tesla T4 GPU芯片等新产品，性能大突破

whale52hertz

于 2019-06-19 14:59:42 发布

阅读量7.8k

点赞数

分类专栏：人工智能资讯文章标签： Nvidia Nvidia Tesla T4 GPU芯片

人工智能资讯专栏收录该内容

911 篇文章

订阅专栏

Nvidia首席执行官在日本GTC会议宣布推出Tesla T4 GPU芯片、TensorRT 5和推理服务器及Jetson AGX Xavier开发套件。T4加速数据中心推理，性能优于P4；TensorRT 5提升推理速度；Jetson AGX Xavier计算性能高、能效优，开发套件已上市。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Nvidia推出Tesla T4 GPU芯片等新产品，性能大突破

文章来源：ATYUN AI平台

Nvidia首席执行官Jensen Huang在日本GTC会议上的演讲中宣布了一系列消息，包括推出Tesla T4 GPU芯片，最新版本的TensorRT 5和TensorRT推理服务器，以及Jetson AGX Xavier开发人员套件。

Tesla T4 GPU芯片

Nvidia今天推出了Tesla T4 GPU芯片，以加速数据中心深度学习系统的推理。T4 GPU采用2560个CUDA内核和320个Tensor内核，处理查询的能力比CPU快近40倍。

作为推动深度学习市场的一部分，两年前Nvidia首次推出专为部署AI模型而制造的Tesla P4芯片。在语音识别推理中，T4比其P4快5倍以上，在视频推理上快3倍。

Nvidia的分析发现，在过去两年中使用P4进行的所有推断中，将近一半与视频有关，其次是语音处理，搜索，自然语言和图像处理。

与基于Pascal的P4不同，T4 采用用于GPU的Turing Tensor Core，这种架构有望为一系列Nvidia芯片提供动力，Huang称之为“自2006年CUDA GPU发明以来的最大飞跃”。

TensorRT 5和TensorRT推理服务器

TensorRT 5支持新的图灵架构，新的优化和INT8 API，与仅使用CPU的平台相比，其推理速度提高了40倍。

这个最新版本大大加快了推荐器，神经机器翻译，语音和自然语言处理应用程序的推理。

TensorRT 5亮点：

对于诸如使用Turing Tensor Cores上的混合精度进行平移的模型，可以将CPU推断速度提高40倍
使用新的INT8 API优化推理模型
支持基于Xavier的NVIDIA驱动器平台和用于FP16的NVIDIA DLA加速器

TensorRT 5将面向NVIDIA开发人员计划的成员。

TensorRT推理服务器是一种容器化微服务，可最大化GPU利用率，并在节点上同时运行来自不同框架的多个模型。它利用Docker和Kubernetes无缝集成到DevOps架构中。

Jetson AGX Xavier

Jetson AGX Xavier能够通过512核集成Volta Tensor Core GPU和双深度学习加速器（DLA）引擎提供高达32 TeraOPS（TOPS）的计算性能。

Jetson AGX Xavier在可部署的节能模块中提供与GPU工作站类似的性能，非常适合将资源密集型自主功能引入智能平台。它为边缘化处理提供了全新的机器人和其他自动化机器，用于制造，零售，医疗保健等。凭借10W，15W和30W之间的用户可配置工作模式，Jetson AGX Xavier的能效比其前身Jetson TX2高出10倍以上，性能高出20倍。

Jetson AGX Xavier开发套件现已上市，售价为2499美元。

本文转自ATYUN人工智能媒体平台，原文链接：Nvidia推出Tesla T4 GPU芯片等新产品，性能大突破

更多推荐

音乐小白也能乐曲创作微软Azure机器学习工作平台教你玩音乐

为降低机器学习开发者门槛，苹果发布了Turi Create框架

以投资者的眼光看待2018年的人工智能领域

本田的无人驾驶汽车和机器人将从中国AI公司获得“智能”

欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:bd@atyun.com — 欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:bd@atyun.com

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。