AMD芯片路线与英伟达周期一致,发布下一代AI PC;Perplexity 推出可撰写研究报告新功能 | AI头条...

整理 | 王轶群

出品 | AI 科技大本营(ID:rgznai100)

3bfa0806cc2f802e5d8573e1948afc0e.png

一分钟速览新闻点!

  • 英伟达宣布2025 年推出 Blackwell Ultra 芯片、2026 年推出Rubin 芯片

  • 华硕、和硕、纬创等公司将利用 Nvidia Blackwell GPU 提供云端、本地、嵌入式和边缘 AI 系统

  • AMD 将推出Instinct MI325X加速器,发布一代AI笔记本电脑的Ryzen AI 300系列

  • 在 Computex 2024上,英伟达 Project G-Assist AI Assistant 揭晓‍

  • AI 搜索引擎 Perplexity 推出 Pages,可进行研究并撰写报告

  • 昆仑万维开源2千亿稀疏大模型天工MoE,系首个支持用单台 4090 服务器推理的开源千亿 MoE大模型

  • 翠贝卡电影节将放映 OpenAI 的 Sora 创作的人工智能短片

  • 调查显示大众并不常用 ChatGPT 等 AI 产品

  • Suno 3.5 版本模型已向所有人开放,可制作 4 分钟歌曲

aeb0c844270b7ef72435803e1087bb2d.png

全球 AI 要闻

英伟达宣布2025 年推出 Blackwell Ultra 芯片、2026 年推出Rubin 芯片

英伟达首席执行官黄仁勋在Computex 2024上发表的主题演讲中表示,Blackwell芯片现已开始投产。他还表示,该公司计划每年升级其 AI 加速器,计划每年升级其 AI 加速器,2025 年推出 Blackwell Ultra 芯片,2026 年推出使用 HBM4 内存的 Blackwell 继任者 Rubin 芯片。

Nvidia 表示,华硕和 MSI 新发布的 RTX AI PC 笔记本电脑将配备高达 GeForce RTX 4070 的 GPU 和“具有 Windows 11 AI PC 功能的片上系统”。

华硕、和硕、纬创等公司将利用 Nvidia Blackwell GPU 提供云端、本地、嵌入式和边缘 AI 系统

Nvidia 首席执行官黄仁勋在 Computex 2024上宣布,全球顶级计算机制造商今天将推出基于Nvidia Blackwell架构的系统,该系统配备 Grace CPU、Nvidia 网络和基础设施,供企业打造 AI 工厂和数据中心。

Nvidia Blackwell 图形处理单元 (GPU) 的能耗降低了 25 倍,并且 AI 处理任务的成本更低。而 Nvidia GB200 Grace Blackwell 超级芯片(即同一封装内包含多个芯片)有望带来卓越的性能提升,与之前的版本相比,LLM 推理工作负载的性能提升高达 30 倍。

黄仁勋表示,为了推动下一波生成式人工智能的发展,ASRock Rack、华硕、技嘉、Ingrasys、英业达、和硕、QCT、超微、纬创和 Wiwynn 将使用 Nvidia 图形处理单元 (GPU) 和网络提供云端、本地、嵌入式和边缘人工智能系统。(VentureBeat)

AMD 将推出Instinct MI325X加速器,发布一代AI笔记本电脑的Ryzen AI 300系列

AMD 宣布每年发布一次数据中心 GPU,AMD详细介绍了其数据中心芯片路线图,其中Instinct MI325X加速器(MI300系列的增强版)计划于第四季度上市。基于下一代架构的本能MI350系列将于2025年发布,而本能MI400系列计划于2026年发布。芯片设计师表示,Instinct MI325X 数据中心 GPU 将在内存容量、内存带宽方面胜过 Nvidia 的 H200。

AMD大约每年一次的发布周期与英伟达首席执行官黄仁勋(Jensen Huang)前一天晚上在 Computex 2024发表演讲时提出的一年一次AI芯片新品发布的计划相符。

“人工智能是我们的首要任务,我们正处于一个令人难以置信的激动人心的时刻的开始,因为人工智能几乎改变了每一项业务,提高了我们的生活质量,重塑了计算市场的每一个部分,”董事长兼首席执行官 Lisa Su 在 Computex 科技大会上表示。 在主题演讲中,Lisa Su发布了用于下一代 AI 笔记本电脑的 Ryzen AI 300系列。这条生产线可能直接与英特尔即将推出的月球湖和高通竞争。 

在 Computex 2024 上,英伟达 Project G-Assist AI Assistant 揭晓

Nvidia 的 G-Assist 是一款 AI 聊天机器人,旨在辅助玩家完成游戏并优化 PC 设置的 AI 助手。

Project G-Assist 接收玩家的语音或文本输入,以及游戏窗口中内容的快照。快照被输入到 AI 视觉模型中,该模型为大型语言模型 (LLM) 提供情境感知和特定于应用的理解,该模型连接到 wiki 等游戏知识数据库。

在技术演示中,G-Assist 展示了它如何通过语音查询回答游戏中的问题,比如 “下一个早期游戏武器是什么,我在哪里可以找到它的制作材料?” 这样的问题。

Nvidia 自己的 AI 助手还可以优化和调整 PC 设置,包括提供过去 60 秒内 PC 延迟和每秒帧数的图表。它可以扫描系统并注意到当显示器支持 240Hz 时,用户只能以 60Hz 的速度玩游戏。用户还可以向助手寻求建议,以提高游戏性能、达到 60fps 的性能目标,甚至超频的 GPU。(The Verge)

AI 搜索引擎 Perplexity 推出 Pages,可进行研究并撰写报告

AI 搜索平台 Perplexity正在推出一项名为 Pages 的新功能,该功能将 根据用户提示生成可自定义的网页。这项新功能就像是制作学校报告的一站式服务,Perplexity 会进行研究和撰写。

Pages 利用Perplexity 的 AI 搜索模型来查找信息,然后创建可以发布并与他人共享的研究演示文稿。Perplexity 在一篇博客文章中表示,它设计 Pages 是为了帮助教育工作者、研究人员和“爱好者”分享他们的知识。(The Verge) 

昆仑万维开源2千亿稀疏大模型天工MoE,系首个支持用单台 4090 服务器推理的开源千亿 MoE大模型

6月3日,昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE , 性能强劲, 同时推理成本更低。Skywork-MoE 基于之前昆仑万维开源的 Skywork-13B 模型中间 checkpoint 扩展而来, 是首个完整将 MoE Upcycling 技术应用并落地的开源千亿 MoE大模型,也是首个支持用单台 4090 服务器推理的开源千亿 MoE大模型。

据悉,Skywork-MoE 的模型权重、技术报告完全开源。

模型权重下载:

https://huggingface.co/Skywork/Skywork-MoE-base

https://huggingface.co/Skywork/Skywork-MoE-Base-FP8

模型开源仓库:

https://github.com/SkyworkAI/Skywork-MoE

模型技术报告:

https://github.com/SkyworkAI/Skywork-MoE/blob/main/skywork-moe-tech-report.pdf

模型推理代码(支持 8x4090 服务器上 8 bit 量化加载推理):

https://github.com/SkyworkAI/vllm

据介绍,本次开源的 Skywork-MoE 模型隶属于天工 3.0 的研发模型系列,是其中的中档大小模型(Skywork-MoE-Medium),模型的总参数量为 146B,激活参数量 22B,共有 16 个 Expert,每个 Expert 大小为 13B,每次激活其中的 2 个 Expert。

同时,天工 3.0 还训练了 75B (Skywork-MoE-Small) 和 400B (Skywork-MoE-Large)两档 MoE 模型,并不在此次开源之列。‍

昆仑万维表示,团队基于目前各大主流模型评测榜单评测了 Skywork-MoE,在相同的激活参数量 20B(推理计算量)下,Skywork-MoE 能力在行业前列,接近 70B 的 Dense 模型,使得模型的推理成本有近 3 倍的下降。同时 Skywork-MoE 的总参数大小比 DeepSeekV2 的总参数大小要小 1/3,用更小的参数规模做到了相近的能力。

436c973a086c10bcf16ed3b34b513922.jpeg

翠贝卡电影节将放映 OpenAI 的 Sora 创作的人工智能短片

2024 年翠贝卡电影节周五宣布将举办 Sora Shorts 短片展映,这是一个新项目,包含五部原创短片,全部使用 OpenAI 的文本转视频 AI 模型 Sora 制作。这不是 AI 电影第一次参加大型电影节,但这是使用 Sora 制作的电影第一次参加。

Sora 尚未向公众发布,即使对于最有经验的 AI 电影制作人来说也是新鲜事物,但 OpenAI 向五位导演提供了该计划的早期使用权——只要他们每个人都同意去年与 DGA、WGA 和 SAG-AFTRA 协会谈判的有关 AI 的电影制作条款。《保姆》导演 Nikyatu Jusu 是利用这项技术为电影节制作电影的五位电影制片人之一。(IndieWire)

调查显示大众并不常用 ChatGPT 等 AI 产品

路透研究院和牛津大学的研究人员调查了阿根廷、丹麦、法国、日本、英国和美国六国的 12,000 人,发现普通大众并不常用 ChatGPT 等热门 AI 产品,18-24 岁的年轻人是例外。研究旨在衡量普通大众对过去两年火热无比的生成式 AI 的看法,结果显示:多数人预测生成式 AI 未来五年会对社会产生重大影响,新闻、媒体和科学领域受影响最大;多数人认为生成式 AI 将改善自己的生活;关于生成式 AI 对社会的影响多数人普遍悲观。虽然多数人都听说过生成式 AI,但有 20%-30% 的人对此一无所知;ChatGPT 是使用率最高的生成式 AI 产品,比 Google Gemini 和 Microsoft Copilot 高出 2-3 倍;18-24 岁人群中有 56% 至少用过 ChatGPT 一次,55 岁及以上人群中这一比例为 16%;大部分人将生成式 AI 用于获取信息、创建媒体如文本、图像、音频和视频,有 5% 的人将其用于获取最新信息。

Suno 3.5 版本模型已向所有人开放,可制作 4 分钟歌曲

据 AI 音乐创作平台 Suno 官方消息,Suno 的最新3.5版本模型已经向所有人开放,这个版本的改进包括:可以制作4分钟的歌曲,创建最长2分钟的歌曲扩展,以及显著改进的歌曲结构。

此前,Suno 宣布将推出全新功能,可以将任何声音创作成歌曲。这项新功能能够将日常生活中的各种声音转化为音乐,为音乐创作带来了全新的可能性。用户只需敲击出节奏,Suno会自动捕捉并与之“和弦”,将这些声音转换为音乐作品。首个示例便是将敲击浇水壶的声音转化为迷幻摇滚音乐,展示了这项技术的强大和创意潜力。

2c919f0cdeb1bbfceaa5ccce6864b41c.gif

开发者正在迎接新一轮的技术浪潮变革。由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的 2024 年度「全球软件研发技术大会」秉承干货实料(案例)的内容原则,将于 7 月 4 日-5 日在北京正式举办。大会共设置了 12 个大会主题:大模型智能应用开发、软件开发智能化、AI 与 ML 智能运维、云原生架构……详情👉:http://sdcon.com.cn/

62fcb39c863e117e0f17631e45978a7b.jpeg

  • 14
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值