英特尔AI训练芯片惊艳亮相:速度与性能双超H200,引领AI新浪潮

英特尔在Intel Vision大会上发布了新一代AI训练芯片Gaudi 3,挑战英伟达H100 GPU。Gaudi 3在训练性能、推理性能和能效方面分别提升70%、50%和40%,并在运行1800亿参数模型时速度较H200快30%。采用台积电5nm工艺,配备128GB HBM2e内存和第五代Tensor Core,支持大规模系统扩展。Gaudi 3将帮助AI发展,推动AI计算进入系统竞赛新时代。
摘要由CSDN通过智能技术生成

 英特尔甩出全新AI训练芯片!跑千亿大模型速度超H200,罕见披露AI浮点性能

   59f7b917549b8929f81d19b6b3ccc62f.jpeg

大规模AI计算已经进入系统竞赛。

英特尔在年度Intel Vision大会上重磅推出新一代AI训练芯片Gaudi 3,正面向英伟达旗舰芯片发起挑战。会上,英特尔CEO基辛格挥舞着Gaudi 3,跟随现场伴奏开心地摇晃起身体,随后宣布Gaudi 3的战绩:相比英伟达上一代旗舰H100 GPU,Gaudi 3的训练性能可提高70%,推理性能提高50%,能效提高40%,同时价格低得多。

b3dce951e111d01595a8de7dedc5b798.jpeg

跑动1800亿参数的Falcon模型时,Gaudi 3推理速度惊艳,较英伟达H200快30%!这款芯片采用先进台积电5nm制程技术,搭载128GB HBM2e DRAM内存与第五代Tensor Core架构,内存带宽高达3.7TB/s,配备24个200Gb以太网端口,性能卓越。尽管英特尔暂未公开晶体管总数,但Gaudi 3的出色表现已充分展现其领先实力,令人期待其未来更多精彩表现!

2d5bb18312343267a1ca1d1a1e7ba6dc.jpeg

和英伟达、AMD一样,英特尔在最新AI芯片中通过“芯片拼装”设计来超越reticle极限。Gaudi 3基于统一内存架构,将将64个Tensor Core封装在两个计算Tile中,共享96MB缓存池,借助高速互连技术,两个计算Tile能宛如一个完整芯片一样运行。

相比上一代Gaudi 2,Gaudi 3在BF16精度下可提供4倍的AI计算能力、1.5倍的内存带宽、2倍的网络带宽,支持大规模系统横向扩展,最多可扩展至8192个芯片的参考架构。

bb1f6ca9a1f326c16a3f049ed9fdb7b0.jpeg

基辛格说,Gaudi 3将帮助AI经历三个阶段,从AI Copilot时代迈向AI Agent时代,然后抵达AI功能时代,即用于自动化复杂的、企业范围的结果。他预言当发展到第三阶段,功能自动化带来的效率意味着或将出现“一人拥有 10亿美元资产的公司”。

英特尔计划从第一季度和第二季度分别开始向OEM/ODM合作伙伴提供风冷版和液冷版的Gaudi 3芯片样品,从第三季度开始加大风冷部件的出货量,第四季度加大液冷设计的出货量。英特尔还将在开发者云中提供Gaudi 3的支持。

9c7f219b97d9801ba1acca734495cd4a.jpeg

Gaudi 3应该会是英特尔最后一代对标H100的AI训练芯片。毕竟对于今年刚发布过最新旗舰GPU芯片B200的英伟达来说,H100/H200已经是上一代的事了。英伟达Blackwell GPU将在今年晚些时候上市,可以想见Gaudi 3抢占

  • 24
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

科技互联人生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值