2024-WK39 前沿技术动态

一、人工智能

1、关于OpenAI

OpenAI向ChatGPT付费用户推出高级语音助手功能

在首次公开发布四个月后,OpenAI向ChatGPT的所有付费用户推出了备受期待的类人高级人工智能(AI)语音助手功能。OpenAI周二宣布,已经开始向订阅OpenAI ChatGPT Plus和Team计划的用户推出新的ChatGPT高级语音模式Advanced Voice。该公司补充称,该功能将从下周开始向OpenAI Edu和Enterprise计划的订阅者开放。



2、视频大模型

字节新发布了豆包视频生成-PixelDance和Seaweed两款新模型

1. 字节发布两款视频生成模型PixelDance和Seaweed,改善了审美和动态表现,解决了多主体互动和一致性问题;

2. 新模型能处理复杂的动作指令和主体互动,如多动作序列捕捉和真实感表达;

3. 视频模型支持多样的镜头语言和高级审美,包括环绕、变焦和目标跟随等,适用于多种视频风格和场景。

更多:https://mp.weixin.qq.com/s/FlyrUWhePcWhfhNuh7tplA



快手最新可灵1.5Pro效果惊艳,让网友陷入疯狂!

1. 快手发布的可灵1.5Pro能够生成1080P影视级视频,且动作、光影和细节还原度极高,超越了Runway等国际产品;

2. 可灵使用OpenAI API,生成的AI视频在表情、动作细节上表现真实,适用于广告、游戏开发等多领域;

3. 可灵1.5Pro操作简单,通过文本输入和参数调整即可快速生成视频,支持用户对运镜、时长等进行自定义设置。

更多:https://mp.weixin.qq.com/s/k8UyWt9tA5qg-nRnL86fFQ



3、语音伪造检测

浙大清华发布语音伪造检测方法SafeEar,兼顾隐私保护

1. 浙大与清华共同开发SafeEar,一种语音伪造检测框架,能在不侵犯隐私的前提下分离语音的声学和语义信息;

2. SafeEar采用神经音频编解码器和多层残差向量量化器,通过瓶颈层和混淆层处理声学信息,提升隐私保护;

3. 框架通过真实环境增强训练,有效应对多样化的信道条件,展现出良好的检测能力和泛化性,错误率(EER)低至2.02%。

更多:https://mp.weixin.qq.com/s/6OWv6nzYoiSRsSv79-FSbQ



4、创新技术理念/架构/方法

谷歌发布创新多轮强化学习方法SCoRe,o1模型使用的类似技术

1. 谷歌DeepMind开发的SCoRe方法通过多轮强化学习和反馈奖励机制,提高大模型在数学和代码领域的自我纠错能力;

2. SCoRe方法使模型在生成数据上进行训练,通过奖励信号调整输出,增强模型在不同情境下的决策正确性;

3. 实验结果表明,使用SCoRe方法的模型在自我纠正能力上有显著提升,Gemini 1.0 Pro和Gemini 1.5 Flash模型分别提升了15.6%和9.1%。

更多:https://mp.weixin.qq.com/s/ealuBaEPX_3QcT-TqQrZGQ



5、开源

OpenAI开源了多语言大规模多任务语言理解(MMMLU)数据集,涵盖57个领域,从初级知识到专业学科;

1. MMLU测试集被翻译成14种语言,采用专业翻译人员确保翻译质量,尤其强化了资源匮乏语言的准确性;

2. 开源努力旨在提高AI模型的多语言执行能力,增强模型对全球用户的包容性和有效性。

更多:https://mp.weixin.qq.com/s/syax9YsTbDWV8YyMAJeYbg



Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上

1. Llama 3.2引入多模态功能,首次支持图文理解;11B和90B视觉模型超越闭源竞争对手;

2. 推出1B和3B轻量级模型,专为Arm处理器优化,适合手机和AR眼镜等终端设备;

3. 轻量模型在隐私保护和本地运行性能表现优秀,支持多种AI任务,提高设备自主性和响应速度。

更多:https://mp.weixin.qq.com/s/3MvuJg-956_mdE3-c-4B4w



二、算力/智能计算

芯片巨头高通向其竞争对手英特尔提出收购计划

1. 高通提出收购英特尔,这将成为近年来最大的半导体行业交易之一,但仍需通过反垄断审查;

2. 英特尔的IDM模式带来了巨额生产成本,尽管CEO帕特·基辛格推行IDM 2.0战略,英特尔在AI和芯片性能上落后于竞争对手;

3. 英特尔面临资金、技术和市场需求的多重挑战,并已实施裁员和资产削减措施来应对市场压力。

更多:https://mp.weixin.qq.com/s/vVxb9DOWNzMb2mUB_ReR-w



百度智能云全面升级百舸AI计算平台

9月25日,在2024百度云智大会上,百度智能云宣布将百舸AI异构计算平台全面升级至4.0版本。据官方介绍,为了解决算力资源短缺的问题,百舸4.0对“多芯混训”能力进行了重点升级,实现了在万卡规模集群上95%的多芯混合训练效能。集群部署环节,升级后的百舸能够实现工具层面的秒级部署,将万卡集群运行准备时间从数周最快缩减至1小时。百舸4.0全面升级了故障检测手段和自动容错机制,在万卡集群上实现了超过99.5%的有效训练时长。



三、低空经济

北京低空经济再添“新宠”,双座电动飞机首飞

北京延庆八达岭机场迎来了北京低空飞行领域的一次里程碑,中国自主研发的RX1E-A双座电动飞机完成首飞仪式,未来将为北京低空经济注入新活力,成为低空经济领域的“新宠”。(央视新闻)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值