2024-WK7 前沿技术动态

一、人工智能

1、关于OpenAI

OpenAI震撼发布o1大模型!「强化学习」突破LLM推理

1. OpenAI发布o1模型,具备强化学习和复杂推理能力,能处理比以往模型更难的科学、代码和数学问题;

2. o1模型通过强化学习训练,优化思维链,提高解决问题的能力,表现在多个基准测试上超越人类专家;

3. o1-mini版本提供成本效率更高的选择,尤其在编程和STEM推理任务上表现出色,但在非STEM任务上表现较差。

更多:https://mp.weixin.qq.com/s/sGcx90Q_uI8se-DKosj9dw



「草莓」将作为ChatGPT服务的一部分发布,但作为独立产品存在,可能通过AI模型下拉菜单提供给用户

1. 「草莓」在响应前有10到20秒的思考时间,仅支持文本输入输出,不支持多模态功能;

2. 「草莓」可能采用不同于现有ChatGPT的定价策略,包括限制每小时消息数量和通过更高价格等级以加快响应速度。

更多:https://mp.weixin.qq.com/s/ylqZ4WdawqKadxrW5rch8w



2、大厂AI应用/技术

谷歌开启Test-Time端新的Scaling Law,小模型越级挑战

1. 小模型通过动态分配测试时计算资源,能超越参数量大14倍的大模型;

2. 研究提出两种测试时计算策略:基于过程的密集验证器奖励模型(PRM)和根据prompt自适应更新响应分布;

3. 测试时计算策略在处理简单和中等难度问题时通常优于增加预训练,但对于更难的问题,增加预训练更有效。

更多:https://mp.weixin.qq.com/s/tfi7VOpSdKIXVb--k6NCSg



夸克CueMe智能助手支持多体裁写作,能生成高质量内容,包括长达2万字的超长文本

1. 体验者强调CueMe的五大优点:体裁丰富、内容准确、文本流畅、字数可控、超长文本能力;

2. CueMe基于夸克大模型开发,优化了长文本理解、专业知识检索、多轮文创指令遵循,提高写作质量和效率。

更多:https://mp.weixin.qq.com/s/-LYKGOKiAsjWI1WSMht_yg



腾讯最新万亿参数异构MoE上线,刷新榜单,技术细节曝光!

1. 腾讯推出混元Turbo,采用分层异构MoE架构,参数总量达万亿级;

2. 模型在国内外benchmark中表现优异,国内排名第一,接近GPT-4o水平;

3. 混元Turbo通过技术创新如异构MoE结构和专项能力优化,显著提升模型性能和推理效率。

更多:https://mp.weixin.qq.com/s/cBtHBBIsk7qq2WFmome6rA



3、视频模型

Adobe新出Firefly视频模型,2分钟速成高清大片

1. Adobe推出Firefly视频模型,能在2分钟内从提示生成高质量视频;

2. 模型支持复杂的视频编辑任务,如色彩校正、动画渲染、音频混合;

3. Firefly适用于动画制作、特效合成,并能进行相机控制如角度和缩放。

更多:https://mp.weixin.qq.com/s/uFKQNGuoZ2bS4Ea0pye71Q



4、RAG

RAG领域,全球首个多语言 ColBERT: Jina ColBERT V2

1. Jina ColBERT V2 支持 89 种语言,提高了多语言检索的效率和准确性,且引入了自定义输出维度选项,减少存储需求;

2. 采用“俄罗斯套娃”式表征学习技术,允许输出向量维度选择,有效平衡存储和计算效率;

3. 在多语言检索性能上优于传统方法,支持高达 8192 tokens 的文档长度,提供灵活的 API 接口,适用于多种平台和应用场景。

更多:https://mp.weixin.qq.com/s/irB0MT64FfCLM5S2UegG5g



5、训练数据

微软用AI Agent生成2500万对高质量数据,极大提升大模型性能!

1. 微软研究院开发的AI Agent "Agent Instruct" 通过创新的“生成教学”方法合成了2500万对高质量数据,用于大模型训练;

2. Agent Instruct通过多阶段处理,包括内容转换、指令创建和指令细化,以增加数据的复杂性和多样性;

3. 使用这些合成数据训练的Orca-3模型在多项基准测试中表现出色,显著超越了其他模型如Mistral-7b和GPT-3.5-turbo。

更多:https://mp.weixin.qq.com/s/ISTwsfmFWRFBPEgbA8iLww



6、创新技术方案

表格增强生成TAG登场:解锁AI自然语言与数据库的完美结合

1. TAG (Table-Augmented Generation) 是一种新方法,用于通过自然语言处理数据库中的问题,提高了数据库查询的灵活性和复杂性处理能力;

2. TAG模型通过三个步骤实现:查询合成、查询执行和答案生成,允许执行更复杂的查询并生成自然语言回答;

3. 在实验中,TAG显示出优于传统Text2SQL和RAG方法的性能,特别是在需要复杂推理和多步查询的场景中。

更多:https://mp.weixin.qq.com/s/6gkPA-xc7GsltM1Ywui_XQ



任意论文一键变播客,谷歌发布Illuminate,重构学习方式

1. Illuminate 能将学术论文转化为 AI 生成的音频讨论,使用谷歌的 LLM Gemini 生成论文摘要和问答;

2. 产品优化针对计算机科学论文,通过 AI 对话形式让用户在多种场景下“聆听”论文核心内容;

3. 用户可通过播客形式预览和学习论文,支持调整语速和分享,但目前仅支持英文且无法下载音频或提供字幕。

更多:https://mp.weixin.qq.com/s/2C2B5yNLjXXYyDQnQgqPyQ



7、开源

国产最大MoE开源模型发布!腾讯AI Lab创始人姚星带队

1. 元象XVERSE发布国内最大MoE开源模型XVERSE-MoE-A36B,拥有2550亿参数,提供无条件免费商用;

2. 该MoE开源模型相比Dense模型训练时间减少30%,推理性能提升100%,通过优化拓扑设计和数据动态切换提高效率;

3. 元象持续开源高性能模型,包括超长上下文窗口大模型,推动AI应用进入长文本时代,同时开发AI互动网文App Saylo。

更多:https://mp.weixin.qq.com/s/xFTmqjMa9BzTXOacSmFQ-w



手机上的“ChatGPT”时刻!面壁智能开源 MiniCPM 3.0,40 亿参数

1. 面壁智能发布了MiniCPM 3.0,一个端侧AI模型,拥有40亿参数,性能超越GPT-3.5,且仅占2GB内存,适用于手机等端侧设备;

2. MiniCPM 3.0采用LLM x MapReduce技术处理长文本,提高了处理长篇文档的能力,并通过函数调用技术实现与外部系统的交互;

3. 该模型开源,支持多种开源推理框架,便于开发者集成并部署在端侧设备上,面向未来可能推广至更广泛的应用开发者。

更多:https://mp.weixin.qq.com/s/_AD6NiRPmacG4r2Q_8vO9w



二、算力集群/芯片

甲骨文推出全球首个 Zettascale 云计算集群,131,072 个 GPU

1. 甲骨文推出全球首个 zettascale 云计算集群,配备 131,072 个 NVIDIA Blackwell GPU,峰值性能达 2.4 zettaFLOPS;

2. Oracle 云基础设施提供前所未有的 GPU 数量和计算能力,支持大规模 AI 工作负载,确保数据主权;

3. Oracle 与 NVIDIA 的合作优化 AI 模型训练与推理速度,支持 OpenAI 扩展 ChatGPT,加强多云战略与 AWS 合作。

更多:https://mp.weixin.qq.com/s/Cv33MCYiKYVRgDNvIm-pPg



AMD放弃旗舰游戏显卡,专注AI,挑战英伟达的CUDA生态

1. AMD放弃旗舰游戏显卡,转向中低端市场,同时专注于AI领域,统一其GPU微架构以挑战英伟达的CUDA生态;

2. AMD计划通过统一架构UDNA,整合消费级RDNA和数据中心CDNA架构,以提高开发效率和吸引更多开发者;

3. AMD的目标是达到与英伟达CUDA相似的开发者规模,使用开源的ROCm软件堆栈来简化开发者的工作,加速生态发展。

更多:https://mp.weixin.qq.com/s/FNW5sS4qVDbyILW-JSNV_g



三、技术风险

阿里云盘出现“灾难级”bug,致用户私密照片泄露

新浪科技讯 9月15日下午消息,针对网友反馈的阿里云盘bug致用户私密照片泄露一事,阿里云盘客服向新浪科技回应称,第一时间核查和处理,已经及时修复。

据报道,9月14日晚间,多名网友发帖称,阿里云盘出现bug,在阿里云盘的相册中,只要创建一个新的文件夹,在分类中选择图片,便加载出了大量其他用户的照片包括自拍、风景照、一家人旅游时的照片等。

针对此事,截止发稿前阿里云盘官方未予置评。

阿里云盘客服则向新浪科技表示,该问题第一时间已经核查和处理,当天已经及时修复。而对于隐私照片被泄露的用户是否会有相应补偿的问题,客服表示需要反馈专人处理。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值