英特尔公布人工智能路线图和芯片与英伟达竞争

新闻分析
2024 年 4 月 9 日8分钟
人工智能CPU 和处理器新兴技术​​​​​​​

在公司年度愿景大会上,英特尔首席执行官帕特·基辛格表示,他认为公司的未来植根于人工智能无处不在的概念。

英特尔周二在Vision 2024 会议上正式推出了 Gaudi 3 处理器,旨在加速企业生成人工智能 (genAI) 工作负载,并公布了一系列下一代产品和战略合作,以提高 genAI 的采用率。

这家芯片制造商的战略涵盖了从数据中心到边缘设备(包括支持人工智能的个人电脑)的所有硬件和云服务路线图。

在主题演讲中,英特尔首席执行官帕特·基辛格 (Pat Gelsinger) 预示了人工智能时代的到来,其中包括将使用全新英特尔酷睿 Ultra 处理器系列的个人电脑。该芯片制造商预计 2024 年 AI PC 处理器出货量将达到 4000 万颗,明年将达到 1 亿颗。

去年 12 月,英特尔最初宣布即将发布用于数据中心人工智能工作负载的 Gaudi 3 处理器,并预览了其第 14 代 Core Ultra“Meteor Lake”数据中心处理器和第 5 代 Xeon 可扩展 CPU。该公司周二正式宣布了后两种处理器。

英特尔还宣布,其下一代Granite Ridge 和 Sierra Forest处理器将被命名为“Xeon 6”,取代使用世代术语的旧营销语言,例如“第五代 Xeon 可扩展”型号。

英特尔芯片晶圆

英特尔首席执行官帕特·基辛格 (PAT GELSINGER) 持有即将推出的至强 6 处理器晶圆。

英特尔

全新至强 6 处理器将纳入对 MXFP4 数据格式的软件支持,与使用 FP16 的第四代至强相比,下一令牌延迟最多可降低 6.5 倍,并能够运行 700 亿参数的 Llama-2 大语言楷模。

在台上演示中,英特尔提供了有关 Gaudi 3 架构、性能以及致力于将其推向市场的 OEM 的新详细信息,并吸引了许多新客户。该公司引用了十多个使用其 Gaudi 3 加速器的“合作伙伴”,包括Naver Corp.BoschNielsenIQSeekr

从历史上看,Nvidia 凭借 GPU(图形处理单元)和 TPU(张量处理单元)引领了 AI 硬件市场,这些产品旨在为大型语言模型和 AI 应用程序提供动力和训练。英特尔将其 Gaudi 3 定位为Nvidia H100 GPU 的直接竞争对手。

与 Nvidia H100 相比,Gaudi 3 的推理能力平均提高了 50%,能效平均提高了 40%,“成本只是后者的一小部分,”Gelsinger 说。据英特尔介绍,Gaudi 3 加速器可为采用BF16浮点格式的计算机内存系统提供四倍的 AI 计算能力,内存带宽是 Gaudi 2 的 1.5 倍;与前身相比,它还提供两倍的网络带宽。

英特尔采用台积电的5纳米工艺制造Gaudi 3芯片,目前该芯片已提供给包括戴尔、HPE、联想和Supermicro在内的原始设备制造商(OEM),用于人工智能数据中心市场。该芯片被设计为与数据中心机架中的数千个其他芯片串在一起。

去年,Nvidia 控制了约 83% 的数据中心芯片市场,其余 17% 的大部分市场由谷歌的定制张量处理单元 (TPU) 占据。

宾夕法尼亚大学工程与应用科学学院教授本杰明·李表示,英特尔的发展轨迹并不容易,它在与英伟达竞争方面面临着挑战。

“英特尔长期以来主导着高性能 CPU 的设计和制造,但最近的挑战反映了计算领域的根本变化,”Lee 说。 “数据中心将继续大量部署CPU来支持互联网服务和云计算,但越来越多地部署GPU来支持AI,而英特尔一直在努力设计有竞争力的GPU。”

英特尔的独特优势在于,它是唯一一家有可能在制造最先进芯片方面与台积电竞争的国内芯片制造商,“这使其在与英伟达和AMD等无晶圆厂竞争对手的竞争中占据上风,”李说。 “英特尔尚未成功建立和发展像台积电这样的代工业务。鉴于现在有如此多的科技公司设计自己的高性能处理器,这对其未来至关重要。”

李表示,英特尔在晶体管技术方面也没有跟上台积电的进步,也没有能力以与台积电代工厂相匹配的精度和效率来满足合同。英特尔目前缺乏满足其自身制造需求和更大客户群的制造能力。

李指出,英特尔首席执行官制定的路线图是明智的,但“价值百万美元的问题是,它是否可以利用《CHIPS 法案》新注入的联邦资金有效地执行该路线图。”

2022 年 8 月,国会通过了《CHIPS 和科学法案》(CHIPS 法案),以解决因 Covid-19 大流行而暴露的处理器短缺问题。该 立法为美国商务部(DoC) 提供了 527 亿美元的资金,用于美国芯片计划 (CHIPS for America) 下的一系列计划,以“重振”美国在半导体研究、开发和制造方面的地位。英特尔预计将获得其中约 85 亿美元的资金。

英特尔公司的基辛格称赞《CHIPS 法案》使该公司去年能够在其位于亚利桑那州钱德勒耗资200 亿美元的Ocotillo 制造工厂中生产出第一批芯片。

然而,目前《CHIPS 法案》几乎没有为英伟达的 GPU、苹果的 NPU 和谷歌的 TPU 等芯片设计商提供直接支持,而所有这些芯片在历史上都曾在美国蓬勃发展。

在其愿景大会上,英特尔还提供了其跨企业人工智能所有领域的下一代产品和服务的最新信息,包括全新的英特尔至强 6 处理器,该处理器可以运行检索增强生成流程(简称“RAG”)

RAG通过使用组织的专有数据和信息创建更加定制和准确的genAI模型;可以大大减少已知的人工智能问题,例如错误输出和幻觉。

基辛格说明了 genAI 使用从互联网上抓取的未实时更新的数据是多么不可靠。

对于标准的法学硕士,“也许如果你真的很优秀,你就会更新和再培训......也许每周一次,也许每月一次?”他说。 “当你将[法学硕士]与来自矢量数据库、流式非结构化数据库的实时数据相结合时——以及将两者实时结合在一起——我们认为这是非常强大的。”

英特尔还表示,本季度将为其下一代数据中心、云和边缘用途处理器发布新品牌。与第二代英特尔至强处理器相比,配备高效内核(E 核——以前的代号为 Sierra Forest)的英特尔至强 6 处理器的每瓦性能提高了 2.4 倍,机架密度提高了 2.7 倍。 

他将英特尔过去十年的创新描述为平淡无奇,称该公司使 PCIe 速度更快了一点,逐步升级了 DDR 内存,并在芯片出厂前添加了“更多核心”。

“无聊,”基辛格说。 “人工智能正在让一切变得令人兴奋,这是我们前所未见的。计算的基本方向是自互联网以来最大的技术变革,它将重塑我们和您业务的各个方面。”

他表示,到本十年末,半导体潜在市场总额预计将从现在的 6000 亿美元增长到超过 1 万亿美元。

为此,基辛格还宣布,该公司的下一代 Core Ultra 客户端处理器系列(代号为 Lunar Lake)将于今年晚些时候推出。这些处理器将为下一代 AI PC 提供超过 100 次平台每秒万亿次运算 (TOPS) 和超过 45 个神经处理单元 (NPU) TOPS。

“英特尔的使命是让人工智能无处不在,”基辛格在亚利桑那州菲尼克斯一个挤满人的礼堂里说道。“我对下一个平台感到非常兴奋。您知道,在竞争对手推出第一款 [AI] 芯片之前,我们正在推出第二款芯片——AI 性能提高 3 倍的 Lunar Lake。而且,第三代正在[制造]。”

基辛格将支持人工智能的个人电脑与 Wi-Fi 进行了比较,他表示,没有人工智能功能的个人电脑将被认为是过时的一天。 “Microsoft Copilot、AI 开发人员、Zoom 和 Teams 总结、翻译、情境化,”他说。 “每个应用程序都在经历人工智能改造。你会错过的。简而言之,是时候更新您的电脑了。”

英特尔还致力于为 AI 结构创建开放的以太网网络模型,并推出了一系列针对 AI 优化的以太网解决方案。该公司正在通过超以太网联盟(UEC)合作设计大型纵向扩展和横向扩展的人工智能结构。

英特尔在一份声明中表示:“这些创新使得能够对日益庞大的模型进行训练和推理,模型的规模每一代都会扩大一个数量级。” “该产品线包括英特尔 AI NIC(网络接口卡)、用于集成到 XPU 中的 AI 连接芯片、基于 Gaudi 的系统,以及一系列适用于英特尔 Foundry 的软硬参考 AI 互连设计。”

  • 8
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 9
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值