英特尔突袭英伟达H100,新AI芯片训练快40%,推理快50%,CEO蹦迪庆祝

金磊 假装发自 凤凰城
量子位 | 公众号 QbitAI

英特尔,开始正面硬刚英伟达了。

就在深夜,英特尔CEO帕特·基辛格手舞足蹈地亮出了最新AI芯片——Gaudi 3

他为什么开心到现场直接蹦迪?

看下Gaudi 3的性能结果,就一目了然了:

  • 训练大模型:比英伟达H100快40%

  • 推理大模型:比英伟达H100快50%

e7643df5e57ba9a06b5939b43cfcb0a9.png

不仅如此,虽然基辛格没有在现场给出直接的数据,但他还表示:

Gaudi 3的性能将与英伟达H200相当,在某些领域的性能甚至会更好。

572247cc3599278d4d934c5816d31f05.gif

如此直面对标英伟达,到底效果如何,我们继续往下看。

硬刚英伟达的Gaudi 3

英特尔表示,Gaudi 3已经在Llama上做了测试,可以有效地训练或部署AI大模型,包括文生图的Stable Diffusion和语音识别的Whisper等等。

402481cfb01920859d3b5ac8ad25d9c2.png
be386551c2ce87359568a98b87c24aa8.png

在现场,基辛格也展示了集成最新英特尔芯片的AI PC,能够快速处理的多项任务,例如快速处理邮件

1dbe63d9f7846e7d7a38a962df841fb6.gif

再如语音处理

c685df2c7f96dcb6c6df6136f09dfb86.gif

以及图像渲染

dcafef17e10f51afec179f34ff00a0a6.png

英特尔演示操作的同事还非常调皮地展示了用AI PC生成的卡通版基辛格:

4537ccc5ebf1a082613ea92703b585c7.png

据了解,Gaudi 3采用5纳米工艺制造,与历代Gaudi其它性能上的具体对比,如下表所示:

78ae0faa62cab3d801d3e0732061c427.png

3dfb6d74fc6fd8a675036f3eb3b30054.png

英特尔表示,Gaudi 3芯片将在今年的第三季度向客户大规模提供,包括戴尔、惠普和超微电脑在内的公司将使用该芯片。

至于具体的价格,目前英特尔方面还并未透露。

不过更令人意外的是,Gaudi 3还只是在这次英特尔Vision活动中发布的产品之一。

Xeon,步入第六代

没错,去年年底英特尔刚刚上市第五代Xeon,仅时隔数个月,第六代Xeon又来了!

(英特尔这次还真没有挤牙膏b52c676c459223a38ed6cf8b3d29ab2b.png

在现场,基辛格还亲切地叫它“little baby”

50291f872d1cda68ac4f8f10bca04554.png

第六代Xeon包含两种架构,分别是Sierra ForestGranite Rapids

Sierra Forest基于英特尔更小、低功耗的E-cores,而Granite Rapids则由更大但性能更高的P-cores 组成。

基辛格在现场称二者像双胞胎

bd1c3184599519f5208f17ce71760ea1.png

更具体而言,Sierra Forest架构的英特尔Xeon 6处理器,其机架密度提高2.7倍。

客户能以近3:1的比例替换旧系统,大幅降低能耗,帮助其实现可持续发展目标。

而Sierra Forest架构的英特尔Xeon 6处理器包含了对MXFP4数据格式的软件支持。

与使用FP16的第四代Xeon处理器相比,可将下一个token的延迟时间最多缩短6.5倍,能够运行700亿参数的Llama-2模型。

92dc6c4c048953b601fc27d68f0ced91.png

至于英特尔Xeon 6处理大模型的速度到底有多快,基辛格做了更加直接的对比。

他将第四代、第五代和最新的第六代Xeon放到了一起,来了一个现场速度的大比拼。

368ffdeff7ccac5ec1f647bf800bf822.png

从直观的生成速度来看,第六代Xeon明显要比“前任们”快上许多。

具体到精确的延时数值,第六代Xeon运行Llama 2 70B只有82ms

4c3854a8f4d2f299749804145711befa.png

同等条件下,第六代Xeon与“前任们”的延时数值对比如下:

4270c5ac8676470abd844f2fa3a28a96.png

据了解,Sierra Forest架构的第六代Xeon处理器将于今年第二季度推出。

网友揭秘英特尔“秘方”

这场硬刚英伟达的发布会,同样也激起了不少网友们的热议。

例如Gaudi 3封装的一处细节,即使用HBM2e存储芯片,有网友对此表示惊讶:

他们使用的是HBM2e,这是英伟达A100在2020年使用的。

而最先进的HBM3e英特尔原本也计划采用,但很可能因为供应不足,这次没能抢到足够的订单。

997531e4c49a60ed7dc377f86d541cd8.png

对此,这位网友进一步表示:

这是英特尔的秘方之一。

他们总能靠旧技术赶上/超越新技术,直到当前的技术在生产、获取和集成上变得更容易。

实际上,制造优势也是英特尔在半导体领域的关键优势之一,作为半导体产业的开创者之一,英特尔几乎拥有芯片产业的所有资源和要素能力。

但何时能够和英伟达全面一较高下?这也是不少网友关注的问题:

这次英特尔硬刚的是H100/H200,那什么时候可以对标英伟达最新的“核弹”B200?

或许答案只有交给时间来回答。

但无论如何,英特尔此次的发布,确实是给AIGC时代的算力,多提供了一项“快好省”的选择。

参考链接:
[1]https://www.anandtech.com/show/21342/intel-introduces-gaudi-3-accelerator-going-bigger-and-aiming-higher
[2]https://www.servethehome.com/intel-vision-2024-keynote-live-coverage/
[3]https://news.ycombinator.com/item?id=39981032

  • 21
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值