马斯克：Grok 正在开发语音交互功能；阶跃星辰开源产品级语音交互大模型 Step-Audio 丨日报

RTE开发者社区

于 2025-02-18 19:10:14 发布

阅读量1.2k

点赞数 15

文章标签：人工智能

本文链接：https://blog.csdn.net/agora_cloud/article/details/145712517

版权

在这里插入图片描述
开发者朋友们大家好：

这里是 「RTE 开发者日报」 ，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@qqq，@鲍勃

01有话题的技术

1、OpenAI 官宣开源！奥特曼在线征集方案，OpenAI 真的要 Open 了

在这里插入图片描述

OpenAI CEO Sam Altman 在 X 平台发文称：

「对于我们的下一个开源项目，我们应当选择开发一个虽然体积小但仍然需要借助 GPU 运行的 o3 mini 层级模型，还是应当致力于开发一个尺寸适合手机且表现最佳的模型呢？」

此外，Altman 还发起了投票。

截至发稿前，端侧模型的投票率大幅领先（编者注：北京时间 18 日下午 o3-mini 反超了），相比于 o3 mini 的开源，显然高赞评论的网友更希望开源 GPT-4。

Altman 曾在本月初公开承认 OpenAI 的闭源策略「站在了历史错误的一边」。( @APPSO)

2、阶跃星辰联合吉利首次开源 Step 系列多模态大模型

IT 之家 2 月 18 日消息，今日阶跃星辰和吉利汽车集团联合宣布，将双方合作的阶跃两款 Step 系列多模态大模型向全球开发者开源。其中，包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃 Step-Video-T2V，以及行业内首款产品级开源语音交互大模型阶跃 Step-Audio。

在这里插入图片描述