2024-WK7 前沿技术动态

朱四龙

于 2024-09-29 15:53:38 发布

阅读量808

点赞数 12

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/maoer95209520/article/details/142637346

版权

一、人工智能

1、关于OpenAI

OpenAI震撼发布o1大模型！「强化学习」突破LLM推理

1. OpenAI发布o1模型，具备强化学习和复杂推理能力，能处理比以往模型更难的科学、代码和数学问题;

2. o1模型通过强化学习训练，优化思维链，提高解决问题的能力，表现在多个基准测试上超越人类专家;

3. o1-mini版本提供成本效率更高的选择，尤其在编程和STEM推理任务上表现出色，但在非STEM任务上表现较差。

更多：https://mp.weixin.qq.com/s/sGcx90Q_uI8se-DKosj9dw

「草莓」将作为ChatGPT服务的一部分发布，但作为独立产品存在，可能通过AI模型下拉菜单提供给用户

1. 「草莓」在响应前有10到20秒的思考时间，仅支持文本输入输出，不支持多模态功能;

2. 「草莓」可能采用不同于现有ChatGPT的定价策略，包括限制每小时消息数量和通过更高价格等级以加快响应速度。

更多：https://mp.weixin.qq.com/s/ylqZ4WdawqKadxrW5rch8w

2、大厂AI应用/技术

谷歌开启Test-Time端新的Scaling Law，小模型越级挑战

1. 小模型通过动态分配测试时计算资源，能超越参数量大14倍的大模型；

2. 研究提出两种测试时计算策略：基于过程的密集验证器奖励模型（PRM）和根据prompt自适应更新响应分布；

3. 测试时计算策略在处理简单和中等难度问题时通常优于增加预训练，但对于更难的问题，增加预训练更有效。

更多：https://mp.weixin.qq.com/s/tfi7VOpSdKIXVb--k6NCSg

夸克CueMe智能助手支持多体裁写作，能生成高质量内容，包括长达2万字的超长文本

1. 体验者强调CueMe的五大优点：体裁丰富、内容准确、文本流畅、字数可控、超长文本能力;

2. CueMe基于夸克大模型开发，优化了长文本理解、专业知识检索、多轮文创指令遵循，提高写作质量和效率。

更多：https://mp.weixin.qq.com/s/-LYKGOKiAsjWI1WSMht_yg

腾讯最新万亿参数异构MoE上线，刷新榜单，技术细节曝光！

1. 腾讯推出混元Turbo，采用分层异构MoE架构，参数总量达万亿级；

2. 模型在国内外benchmark中表现优异，国内排名第一，接近GPT-4o水平；

3. 混元Turbo通过技术创新如异构MoE结构和专项能力优化，显著提升模型性能和推理效率。

更多：https://mp.weixin.qq.com/s/cBtHBBIsk7qq2WFmome6rA

3、视频模型

Adobe新出Firefly视频模型，2分钟速成高清大片

1. Adobe推出Firefly视频模型，能在2分钟内从提示生成高质量视频；

2. 模型支持复杂的视频编辑任务，如色彩校正、动画渲染、音频混合；

3. Firefly适用于动画制作、特效合成，并能进行相机控制如角度和缩放。

更多：https://mp.weixin.qq.com/s/uFKQNGuoZ2bS4Ea0pye71Q

4、RAG

RAG领域，全球首个多语言 ColBERT: Jina ColBERT V2

1. Jina ColBERT V2 支持 89 种语言，提高了多语言检索的效率和准确性，且引入了自定义输出维度选项，减少存储需求;

2. 采用“俄罗斯套娃”式表征学习技术，允许输出向量维度选择，有效平衡存储和计算效率;

3. 在多语言检索性能上优于传统方法，支持高达 8192 tokens 的文档长度，提供灵活的 API 接口，适用于多种平台和应用场景。

更多：https://mp.weixin.qq.com/s/irB0MT64FfCLM5S2UegG5g

5、训练数据

微软用AI Agent生成2500万对高质量数据，极大提升大模型性能！

1. 微软研究院开发的AI Agent "Agent Instruct" 通过创新的“生成教学”方法合成了2500万对高质量数据，用于大模型训练;

2. Agent Instruct通过多阶段处理，包括内容转换、指令创建和指令细化，以增加数据的复杂性和多样性;

3. 使用这些合成数据训练的Orca-3模型在多项基准测试中表现出色，显著超越了其他模型如Mistral-7b和GPT-3.5-turbo。

更多：https://mp.weixin.qq.com/s/ISTwsfmFWRFBPEgbA8iLww

6、创新技术方案

表格增强生成TAG登场：解锁AI自然语言与数据库的完美结合

1. TAG (Table-Augmented Generation) 是一种新方法，用于通过自然语言处理数据库中的问题，提高了数据库查询的灵活性和复杂性处理能力;

2. TAG模型通过三个步骤实现：查询合成、查询执行和答案生成，允许执行更复杂的查询并生成自然语言回答;

3. 在实验中，TAG显示出优于传统Text2SQL和RAG方法的性能，特别是在需要复杂推理和多步查询的场景中。

更多：https://mp.weixin.qq.com/s/6gkPA-xc7GsltM1Ywui_XQ

任意论文一键变播客，谷歌发布Illuminate，重构学习方式

1. Illuminate 能将学术论文转化为 AI 生成的音频讨论，使用谷歌的 LLM Gemini 生成论文摘要和问答;

2. 产品优化针对计算机科学论文，通过 AI 对话形式让用户在多种场景下“聆听”论文核心内容;

3. 用户可通过播客形式预览和学习论文，支持调整语速和分享，但目前仅支持英文且无法下载音频或提供字幕。

更多：https://mp.weixin.qq.com/s/2C2B5yNLjXXYyDQnQgqPyQ

7、开源

国产最大MoE开源模型发布！腾讯AI Lab创始人姚星带队

1. 元象XVERSE发布国内最大MoE开源模型XVERSE-MoE-A36B，拥有2550亿参数，提供无条件免费商用;

2. 该MoE开源模型相比Dense模型训练时间减少30%，推理性能提升100%，通过优化拓扑设计和数据动态切换提高效率;

3. 元象持续开源高性能模型，包括超长上下文窗口大模型，推动AI应用进入长文本时代，同时开发AI互动网文App Saylo。

更多：https://mp.weixin.qq.com/s/xFTmqjMa9BzTXOacSmFQ-w

手机上的“ChatGPT”时刻！面壁智能开源 MiniCPM 3.0，40 亿参数

1. 面壁智能发布了MiniCPM 3.0，一个端侧AI模型，拥有40亿参数，性能超越GPT-3.5，且仅占2GB内存，适用于手机等端侧设备;

2. MiniCPM 3.0采用LLM x MapReduce技术处理长文本，提高了处理长篇文档的能力，并通过函数调用技术实现与外部系统的交互;

3. 该模型开源，支持多种开源推理框架，便于开发者集成并部署在端侧设备上，面向未来可能推广至更广泛的应用开发者。

更多：https://mp.weixin.qq.com/s/_AD6NiRPmacG4r2Q_8vO9w

二、算力集群/芯片

甲骨文推出全球首个 Zettascale 云计算集群，131,072 个 GPU

1. 甲骨文推出全球首个 zettascale 云计算集群，配备 131,072 个 NVIDIA Blackwell GPU，峰值性能达 2.4 zettaFLOPS；

2. Oracle 云基础设施提供前所未有的 GPU 数量和计算能力，支持大规模 AI 工作负载，确保数据主权；

3. Oracle 与 NVIDIA 的合作优化 AI 模型训练与推理速度，支持 OpenAI 扩展 ChatGPT，加强多云战略与 AWS 合作。

更多：https://mp.weixin.qq.com/s/Cv33MCYiKYVRgDNvIm-pPg

AMD放弃旗舰游戏显卡，专注AI，挑战英伟达的CUDA生态

1. AMD放弃旗舰游戏显卡，转向中低端市场，同时专注于AI领域，统一其GPU微架构以挑战英伟达的CUDA生态;

2. AMD计划通过统一架构UDNA，整合消费级RDNA和数据中心CDNA架构，以提高开发效率和吸引更多开发者;

3. AMD的目标是达到与英伟达CUDA相似的开发者规模，使用开源的ROCm软件堆栈来简化开发者的工作，加速生态发展。

更多：https://mp.weixin.qq.com/s/FNW5sS4qVDbyILW-JSNV_g

三、技术风险

阿里云盘出现“灾难级”bug，致用户私密照片泄露

新浪科技讯 9月15日下午消息，针对网友反馈的阿里云盘bug致用户私密照片泄露一事，阿里云盘客服向新浪科技回应称，第一时间核查和处理，已经及时修复。

据报道，9月14日晚间，多名网友发帖称，阿里云盘出现bug，在阿里云盘的相册中，只要创建一个新的文件夹，在分类中选择图片，便加载出了大量其他用户的照片包括自拍、风景照、一家人旅游时的照片等。

针对此事，截止发稿前阿里云盘官方未予置评。

阿里云盘客服则向新浪科技表示，该问题第一时间已经核查和处理，当天已经及时修复。而对于隐私照片被泄露的用户是否会有相应补偿的问题，客服表示需要反馈专人处理。

关注

12
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。