【极客技术】英特尔的“Gaudi 3”人工智能加速芯片可能会让英伟达H100面临挑战...

英特尔在Vision2024活动中发布了Gaudi3AI加速芯片,声称在运行大型语言模型时速度比NvidiaH100快50%,特别针对OpenAI和Meta的模型。Gaudi3的性能提升体现在训练和推理速度,且强调能效,可能成为H100的竞争者。
摘要由CSDN通过智能技术生成

英特尔声称,在运行人工智能语言模型时,其速度比市场领先者快50%。

4月9日,英特尔在凤凰城举办的Vision 2024活动上发布了一款名为“Gaudi 3”的新型人工智能加速芯片。由于在运行大型语言模型(如ChatGPT所依赖的模型)时表现出强大的性能,英特尔将Gaudi 3定位为Nvidia H100的替代品。H100是一款颇受欢迎的数据中心GPU,虽然一度供不应求,但情况似乎正在逐渐缓解。

与Nvidia的H100芯片相比,英特尔预计,无论是OpenAI的GPT-3 175B大型语言模型,还是Meta的Llama 2的70亿参数版本,在Gaudi 3上的训练时间都将快50%。在推理(运行已训练模型以获取输出)方面,英特尔声称其新型AI芯片在Llama 2和Falcon 180B这两个开源模型上的性能比H100快50%。

英特尔之所以瞄准H100,是因为其市场占有率高,但这款芯片并非英伟达即将推出的最强大的AI加速芯片。虽然英伟达已宣布H200和Blackwell B200两款芯片,且在纸面性能上已经超越了H100,但这两款芯片都尚未上市(H200预计将于2024年第二季度上市——也就是近期内)。

与此同时,上述H100的供应问题一直是科技公司和AI研究人员的一大困扰,他们不得不争夺任何能够训练AI模型的芯片。这导致微软、Meta和OpenAI(据传)等多家科技公司寻求自己设计AI加速芯片,尽管这些定制芯片通常由英特尔或台积电制造。谷歌自2015年以来一直在内部使用自己的张量处理单元(TPU)系列。

鉴于上述问题,如果英特尔能够以理想的价格(英特尔尚未提供,但据报道H100的价格约为3万至4万美元)推出Gaudi 3,并维持充足的生产,那么它可能会成为H100的一个有吸引力的替代品。AMD也生产了一系列具有竞争力的AI芯片,如AMD Instinct MI300系列,售价约为1万至1.5万美元。

“Gaudi 3”的性能

英特尔表示,这款新芯片在其前身Gaudi 2架构的基础上进行了升级,采用了两个通过高带宽连接相连的相同硅晶片。每个晶片包含一个48兆字节的中央缓存存储器,周围有四个矩阵乘法引擎和32个可编程张量处理器内核,总计64个内核。 

这家芯片制造巨头声称,Gaudi 3使用8位浮点基础设施的AI计算能力达到Gaudi 2的两倍,这在训练Transformer模型方面至关重要。同时,该芯片使用BFloat 16位数值格式进行计算的性能也提升了四倍。此外,Gaudi 3还配备了128GB价格相对实惠的HBM2e内存容量(这可能有助于其价格上的竞争力),并具备3.7TB的内存带宽。

鉴于数据中心以高耗电量著称,英特尔强调Gaudi 3的能效,声称与英伟达的H100相比,在处理Llama 7B和70B参数以及Falcon 180B参数模型时,其推理能效提高了40%。英特尔Habana Labs的首席运营官伊坦·梅迪纳(Eitan Medina)将此优势归功于Gaudi的大型矩阵数学引擎,他声称与其他架构相比,这些引擎所需的内存带宽显著减少。

Gaudi vs. Blackwell

上个月,我们报道了英伟达声势浩大的Blackwell架构发布,其中包括B200 GPU,英伟达声称这将是世界上最强大的AI芯片。因此,将英伟达性能最高的AI芯片与英特尔目前能生产出的最佳产品进行比较,似乎顺理成章。

据IEEE Spectrum报道,Gaudi 3采用了台积电(TSMC)的N5制程技术,从而缩小了英特尔与英伟达在半导体制造技术方面的差距。即将推出的英伟达Blackwell芯片将使用定制的N4P制程,据报道,该制程在性能和效率方面相比N5有所改进。

与竞品芯片中使用的更昂贵的HBM3或HBM3e相比,Gaudi 3使用的HBM2e内存(如我们之前提到的)在性能和成本效益之间取得了平衡。这一选择似乎强调了英特尔不仅在性能上竞争,而且在价格上也进行竞争的策略。

至于Gaudi 3和B200在原始性能上的比较,只有在芯片发布并由第三方进行基准测试后,我们才能得知。

随着科技行业对AI计算能力需求激增的竞赛持续升温,IEEE Spectrum指出,英特尔Gaudi芯片的下一代产品,代号为Falcon Shores的芯片仍备受关注。英特尔是否会继续依赖台积电的技术,还是利用自家的代工业务以及即将推出的纳米片晶体管技术,在AI加速器市场上获得竞争优势,目前尚不得而知。

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SQLAlchemy 是一个 SQL 工具包和对象关系映射(ORM)库,用于 Python 编程语言。它提供了一个高级的 SQL 工具和对象关系映射工具,允许开发者以 Python 类和对象的形式操作数据库,而无需编写大量的 SQL 语句。SQLAlchemy 建立在 DBAPI 之上,支持多种数据库后端,如 SQLite, MySQL, PostgreSQL 等。 SQLAlchemy 的核心功能: 对象关系映射(ORM): SQLAlchemy 允许开发者使用 Python 类来表示数据库表,使用类的实例表示表中的行。 开发者可以定义类之间的关系(如一对多、多对多),SQLAlchemy 自动处理这些关系在数据库中的映射。 通过 ORM,开发者可以像操作 Python 对象一样操作数据库,这大大简化了数据库操作的复杂性。 表达式语言: SQLAlchemy 提供了一个丰富的 SQL 表达式语言,允许开发者以 Python 表达式的方式编写复杂的 SQL 查询。 表达式语言提供了对 SQL 语句的灵活控制,同时保持了代码的可读性和可维护性。 数据库引擎和连接池: SQLAlchemy 支持多种数据库后端,并且为每种后端提供了对应的数据库引擎。 它还提供了连接池管理功能,以优化数据库连接的创建、使用和释放。 话管理: SQLAlchemy 使用话(Session)来管理对象的持久化状态。 话提供了一个工作单元(unit of work)和身份映射(identity map)的概念,使得对象的状态管理和查询更加高效。 事件系统: SQLAlchemy 提供了一个事件系统,允许开发者在 ORM 的各个生命周期阶段插入自定义的钩子函数。 这使得开发者可以在对象加载、修改、删除等操作时执行额外的逻辑。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值