一、人工智能
1、关于OpenAI
OpenAI向ChatGPT付费用户推出高级语音助手功能
在首次公开发布四个月后,OpenAI向ChatGPT的所有付费用户推出了备受期待的类人高级人工智能(AI)语音助手功能。OpenAI周二宣布,已经开始向订阅OpenAI ChatGPT Plus和Team计划的用户推出新的ChatGPT高级语音模式Advanced Voice。该公司补充称,该功能将从下周开始向OpenAI Edu和Enterprise计划的订阅者开放。
2、视频大模型
字节新发布了豆包视频生成-PixelDance和Seaweed两款新模型
1. 字节发布两款视频生成模型PixelDance和Seaweed,改善了审美和动态表现,解决了多主体互动和一致性问题;
2. 新模型能处理复杂的动作指令和主体互动,如多动作序列捕捉和真实感表达;
3. 视频模型支持多样的镜头语言和高级审美,包括环绕、变焦和目标跟随等,适用于多种视频风格和场景。
更多:https://mp.weixin.qq.com/s/FlyrUWhePcWhfhNuh7tplA
快手最新可灵1.5Pro效果惊艳,让网友陷入疯狂!
1. 快手发布的可灵1.5Pro能够生成1080P影视级视频,且动作、光影和细节还原度极高,超越了Runway等国际产品;
2. 可灵使用OpenAI API,生成的AI视频在表情、动作细节上表现真实,适用于广告、游戏开发等多领域;
3. 可灵1.5Pro操作简单,通过文本输入和参数调整即可快速生成视频,支持用户对运镜、时长等进行自定义设置。
更多:https://mp.weixin.qq.com/s/k8UyWt9tA5qg-nRnL86fFQ
3、语音伪造检测
浙大清华发布语音伪造检测方法SafeEar,兼顾隐私保护
1. 浙大与清华共同开发SafeEar,一种语音伪造检测框架,能在不侵犯隐私的前提下分离语音的声学和语义信息;
2. SafeEar采用神经音频编解码器和多层残差向量量化器,通过瓶颈层和混淆层处理声学信息,提升隐私保护;
3. 框架通过真实环境增强训练,有效应对多样化的信道条件,展现出良好的检测能力和泛化性,错误率(EER)低至2.02%。
更多:https://mp.weixin.qq.com/s/6OWv6nzYoiSRsSv79-FSbQ
4、创新技术理念/架构/方法
谷歌发布创新多轮强化学习方法SCoRe,o1模型使用的类似技术
1. 谷歌DeepMind开发的SCoRe方法通过多轮强化学习和反馈奖励机制,提高大模型在数学和代码领域的自我纠错能力;
2. SCoRe方法使模型在生成数据上进行训练,通过奖励信号调整输出,增强模型在不同情境下的决策正确性;
3. 实验结果表明,使用SCoRe方法的模型在自我纠正能力上有显著提升,Gemini 1.0 Pro和Gemini 1.5 Flash模型分别提升了15.6%和9.1%。
更多:https://mp.weixin.qq.com/s/ealuBaEPX_3QcT-TqQrZGQ
5、开源
OpenAI开源了多语言大规模多任务语言理解(MMMLU)数据集,涵盖57个领域,从初级知识到专业学科;
1. MMLU测试集被翻译成14种语言,采用专业翻译人员确保翻译质量,尤其强化了资源匮乏语言的准确性;
2. 开源努力旨在提高AI模型的多语言执行能力,增强模型对全球用户的包容性和有效性。
更多:https://mp.weixin.qq.com/s/syax9YsTbDWV8YyMAJeYbg
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上
1. Llama 3.2引入多模态功能,首次支持图文理解;11B和90B视觉模型超越闭源竞争对手;
2. 推出1B和3B轻量级模型,专为Arm处理器优化,适合手机和AR眼镜等终端设备;
3. 轻量模型在隐私保护和本地运行性能表现优秀,支持多种AI任务,提高设备自主性和响应速度。
更多:https://mp.weixin.qq.com/s/3MvuJg-956_mdE3-c-4B4w
二、算力/智能计算
芯片巨头高通向其竞争对手英特尔提出收购计划
1. 高通提出收购英特尔,这将成为近年来最大的半导体行业交易之一,但仍需通过反垄断审查;
2. 英特尔的IDM模式带来了巨额生产成本,尽管CEO帕特·基辛格推行IDM 2.0战略,英特尔在AI和芯片性能上落后于竞争对手;
3. 英特尔面临资金、技术和市场需求的多重挑战,并已实施裁员和资产削减措施来应对市场压力。
更多:https://mp.weixin.qq.com/s/vVxb9DOWNzMb2mUB_ReR-w
百度智能云全面升级百舸AI计算平台
9月25日,在2024百度云智大会上,百度智能云宣布将百舸AI异构计算平台全面升级至4.0版本。据官方介绍,为了解决算力资源短缺的问题,百舸4.0对“多芯混训”能力进行了重点升级,实现了在万卡规模集群上95%的多芯混合训练效能。集群部署环节,升级后的百舸能够实现工具层面的秒级部署,将万卡集群运行准备时间从数周最快缩减至1小时。百舸4.0全面升级了故障检测手段和自动容错机制,在万卡集群上实现了超过99.5%的有效训练时长。
三、低空经济
北京低空经济再添“新宠”,双座电动飞机首飞
北京延庆八达岭机场迎来了北京低空飞行领域的一次里程碑,中国自主研发的RX1E-A双座电动飞机完成首飞仪式,未来将为北京低空经济注入新活力,成为低空经济领域的“新宠”。(央视新闻)