AI Weekly『12月9-15日』:OpenAI发布Sora,谷歌发布Gemini 2.0,xAI免费开放使用!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

关于AI Weekly

马化腾谈及AI时说:“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇,所以我们觉得非常重要。”

AI Weekly回来了!

AI Weekly”是AI领域的前沿资讯周报,每周与你相约,精心筛选并总结过去一周内AI领域最重要、最具影响力的事件。这个专栏致力于打破信息壁垒,帮助你高效掌握最新动态,增强对AI技术及应用趋势的洞察力。

省流版摘要

  1. OpenAI连续12天直播发布:本周推出多项新模型/功能,包括文生视频模型Sora、升级版ChatGPT Canvas、深度集成ChatGPT的Apple Intelligence、视频聊天功能(支持屏幕共享和圣诞模式)以及ChatGPT Projects。

  2. 谷歌发布Gemini 2.0模型:性能显著提升,关键基准测试速度较Gemini 1.5 Pro快两倍,新增多模态输出功能,并支持自主决策能力。

  3. xAI新版Grok-2模型向全体用户免费开放:新版Grok-2支持网页搜索和引用功能,实时整合X平台信息,Premium用户享有更多功能和更高的使用限制。

  4. 阶跃星辰发布千亿参数语音大模型Step-1o :国内首个端到端语音大模型,支持语音和文本输入输出,具有情感识别、深度模仿和自学习能力,近期将接入“跃问”App。

  5. 字节跳动豆包电脑版上线视频生成功能:视频生成模型PixelDance开启内测,每日可免费生成十支视频,适用于广告、电商和文旅等领域。

  6. 360推出自研推理模型360gpt2-o1 :在数学和逻辑推理任务上表现优异,显著超越前代模型360gpt2-pro,适用于复杂推理和学术场景。

1. OpenAI连续12天直播发布,本周推出Sora文生视频模型

为方便阅读,关于OpenAI连续12天直播发布活动相关的信息均整合到了这条新闻下。

本周是OpenAI直播活动的第二周,对应Day 3 - Day 7,主要发布内容包括:

文生视频模型Sora ,Sora是作为一个独立的产品发布的(sora.com),刚发布时由于OpenAI准备不足,太多人同时涌入,Sora被迫关闭了注册,目前已正常开放。

ChatGPT Canvas,新发布的Canvas是之前beta版本的升级版,加入了直接在沙盒运行Python代码的功能,并向所有用户开放使用,包括免费用户。

Apple Intelligence,即深度集成了ChatGPT的Apple Intelligence,尤其是Siri。遗憾的是,Apple Intelligence并未在国区设备上开放,开放时间待定。

高级语音模式视觉功能,现在你可以和ChatGPT视频聊天了,大大扩展了ChatGPT实时语音功能的使用场景,另外也支持屏幕共享,以及新推出的圣诞老人模式。

ChatGPT Projects,本周最实用的功能,能够有效进行历史对话管理,支持同一项目下的知识库管理和自定义指令,以及Canvas和联网搜索。

日期发布关键词详细解读文章
🌟 Day 1满血版 o1ChatGPT Pro 新套餐
✨ Day 2强化学习微调(Reinforcement Fine-Tuning, RFT)
🎥 Day 3文生视频模型 Sora
🖌️ Day 4ChatGPT Canvas
🍎 Day 5Apple Intelligence
🎄 Day 6视频聊天屏幕共享圣诞模式
🚀 Day 7ChatGPT Projects

2. 谷歌发布Gemini 2.0:性能提升,押注AI Agent

2024年12月11日,谷歌正式推出其最新AI模型Gemini 2.0。该模型在关键基准测试中表现出色,性能与Gemini 1.5 Pro相当,响应速度则是其两倍。

Gemini 2.0引入了多模态功能,支持原生图像和音频输出,并具备自主决策能力,可在用户最少干预下完成复杂任务。目前,谷歌推出的是该系列模型的首发实验版本Gemini 2.0 Flash,旨在提高任务执行的速度和效率。

3. xAI宣布新版Grok-2模型向X平台全体用户免费开放

2024年12月13日,埃隆·马斯克旗下的人工智能公司xAI宣布,其最新版本的Grok-2聊天机器人现已免费向所有X平台用户开放。此前,该服务仅面向付费用户提供。根据新政策,所有用户均可使用Grok-2模型,而Premium和Premium+用户将享有更高的使用限制,并优先体验未来的新功能。

Grok-2模型能够实时整合X平台的信息,为用户提供更直观、可控且多样化的互动体验。此外,Grok-2还引入了网页搜索和引用功能,利用X平台的帖子和更广泛的互联网资源,为用户的查询提供及时且准确的答案。引用功能使用户能够深入了解信息来源,便于获取更多信息或验证Grok提供的内容。

4. 阶跃星辰推出国内首个千亿参数端到端语音大模型Step-1o

2024年12月13日,人工智能公司阶跃星辰发布了Step-1o,据称是国内首个千亿参数的端到端语音大模型。与传统的级联式语音模型不同,Step-1o直接处理语音输入和输出(类似于ChatGPT高级语音模式的GPT-4o),避免了中间的文本转换过程,从而提高了传输效率,并保留了情感等信息。

Step-1o支持语音、文本等多种输入输出形式,能够快速响应并允许随时打断。它还具备深度理解和模仿音色、韵律、方言等特征的能力,可通过自我学习不断提升回复质量,提供专业建议和情感陪伴。阶跃星辰官方表示Step-1o近期将接入“跃问”App,为用户提供实时语音通话服务。

5. 字节跳动豆包电脑版上线视频生成功能

字节跳动旗下的AI助手豆包近期在电脑版中开启了视频生成模型PixelDance的内测。部分用户已获得体验资格,每日可免费生成十支视频。

PixelDance采用DiT(扩散Transformer)架构,具备出色的语义理解能力,能够将文本或图片信息转化为生动逼真的视频内容。该模型支持复杂的动态运镜、多镜头切换,并能保持内容一致性,适用于电商营销、动画教育、城市文旅等领域。此前,豆包已在即梦AI和火山引擎平台上进行小范围测试。

6. 360推出自研推理模型360gpt2-o1

2024年12月13日,360公司在其官方公众号“360智脑”宣布,正式推出自研推理大模型360gpt2-o1360gpt2-o1通过合成数据优化、模型后训练和“慢思考”范式实现AI模型推理能力的突破。在多项基础数学评测(如MATH、高考数学)以及权威数学竞赛(包括AIME24、AMC23)中,360gpt2-o1均取得了优异成绩,不仅超越了前代模型360gpt2-pro,也优于GPT-4o模型(来自于360自己的宣传)。

别的不说,360是会给模型起名的,为什么非要加一个“o1”在模型名中呢?!


精选推荐


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值