阿里、腾讯、字节纷纷开源!

AI科技圈最近一周又发生了啥

阿里开源ZeroSearch框架,AI搜索成本大幅降低,效果媲美谷歌

阿里巴巴通义团队开源了ZeroSearch框架,这是一款无需调用外部搜索引擎的生成式搜索引擎框架。通过强化学习和轻量级监督微调,ZeroSearch能够在不依赖真实搜索引擎的情况下训练出强大的搜索能力。实验表明,使用14B参数模型的ZeroSearch在四块A100 GPU上训练,成本仅为70.8美元,相比传统方法降低了88%。此外,其检索模块在多个公开问答数据集上表现优异,甚至超越谷歌搜索结果质量。ZeroSearch还具有广泛的兼容性和扩展能力,支持多种大语言模型。相关代码、数据集和预训练模型已在GitHub和Hugging Face上公开

https://github.com/Alibaba-nlp/ZeroSearch

字节跳动开源 Deep Research 项目 DeerFlow,助力多智能体研究与协作

字节跳动近日开源了一款名为 DeerFlow 的 Deep Research 项目,旨在通过创新的多智能体架构设计提升研究效率。该项目基于 LangChain 和 LangGraph 开源框架构建,采用独家的 Research Team 机制,支持多轮对话与任务执行,显著减少 Tokens 消耗和 API 调用次数。此外,DeerFlow 还支持 MCP 无缝集成、AI 生成的 Prompt 优化以及从报告生成播客和 PPT 等功能,为用户提供高效且灵活的研究工具

https://github.com/bytedance/deer-flow

腾讯开源多模态视频生成工具 HunyuanCustom

腾讯推出并开源了多模态定制化视频生成工具 HunyuanCustom,基于混元视频生成大模型打造,具备单主体、多主体视频生成、视频局部编辑等能力,生成视频与输入主体高度一致。用户仅需上传图片和文本描述,即可生成连贯自然的视频内容。该工具还支持音频驱动和视频驱动模式,适用于数字人直播、虚拟客服、广告创意等场景,满足不同用户需求,展现了强大的可控性、一致性和高质量生成能力。更多技术细节可在开源项目官网查看

https://github.com/Tencent/HunyuanCustom

ChatGPT深度研究功能连接GitHub

ChatGPT推出了深度研究功能,可直接连接GitHub,为开发者提供项目分析、代码质量改进建议等服务。用户通过连接GitHub代码库后,ChatGPT能够实时读取代码及相关文档,自动生成搜索关键词查找相关内容,并引用片段解答问题。目前该功能处于测试阶段,已向全球Team用户开放,未来将逐步覆盖Plus、Pro用户。此外,OpenAI还发布了强化微调功能,可提升模型在复杂领域的性能

https://mp.weixin.qq.com/s/5V4lbj25QuX3qmQHsN-a1Q

Mistral AI 推出 Mistral Medium 3:高效能与低成本的语言模型

Mistral AI 发布了 Mistral Medium 3,一款在性能与成本之间达到完美平衡的新型语言模型。该模型以仅 8 倍更低的成本,实现了与大型模型相当的前沿性能,并在编码和多模态理解等专业领域表现出色。Mistral Medium 3 的部署成本低至每百万输入标记 0.4 美元、输出标记 2 美元,同时支持混合部署、定制后训练以及与企业工具的无缝集成。它在学术基准测试和第三方人类评估中均展现出卓越表现,尤其在编码领域超越了多个大型竞争对手。目前,该模型的 API 已在 Mistral La Plateforme 和 Amazon Sagemaker 上线,并将很快扩展到其他主要云平台

https://mistral.ai/news/mistral-medium-3

清华、星动纪元开源首个AIGC机器人大模型,入选ICML2025 Spotlight

清华大学叉院ISRLab与星动纪元联合开发的AIGC生成式机器人大模型VPP(Video Prediction Policy)正式开源,并入选ICML2025 Spotlight。VPP利用预训练视频生成大模型,通过大量互联网视频数据训练,直接学习人类动作,减轻了对高质量机器人真机数据的依赖,并可在不同人形机器人本体间切换,加速人形机器人商业化落地。该模型在Calvin ABC-D基准测试中任务完成平均长度达4.33,接近满分5.0,提升41.5%;在真实世界测试中,单臂平台可完成100+种复杂灵巧操作任务,双臂平台可完成50+种任务,展现了强大的多任务学习与泛化能力

https://github.com/roboterax/video-prediction-policy

Gemini 2.5 Pro升级,编程能力大幅提升,成新“编程模型之王”

Google DeepMind发布Gemini 2.5 Pro (I/O edition)最新版本,其编程能力显著增强,在LMArena编程排行榜上位居第一,WebDev Arena排行榜上更是超越昔日霸主Claude 3.7 Sonnet。用户仅需一个提示词或一张手绘草图加功能描述,即可构建Web应用、游戏和模拟程序等。此外,该版本在视频理解方面表现一流,VideoMME基准测试中得分高达84.8%。谷歌多位高管纷纷站台,其原计划在Google I/O大会上发布的Gemini 2.5 Pro Preview (I/O edition)因热情高涨提前发布

https://mp.weixin.qq.com/s/6wv6tUVYsJPfaN-7HxUjoQ

Kimi 长思考模型 API 正式发布,助力复杂问题深度推理

月之暗面推出的 kimi-thinking-preview 模型正式上线,该模型具备多模态推理能力和通用推理能力,擅长处理复杂的代码、数学及工作问题。模型通过 “reasoning_content” 字段展示推理过程,支持流式输出以优化用户体验。目前处于预览版阶段,暂不支持工具调用、联网搜索等功能

https://mp.weixin.qq.com/s/vJIZ9wu_IWPCGxm0pyB-ZQ

OpenAI 宣布重大转型:营利业务转为公共利益公司,致力于民主化 AI

OpenAI 近日宣布其营利业务将转型为公共利益公司(PBC),由非营利组织继续掌控并成为重要股东。这一调整旨在更好地实现其使命——确保通用人工智能(AGI)造福全人类。公司计划放弃复杂的“利润上限结构”,转为常规股权结构,同时开源部分强大模型,推动 AI 的民主化。OpenAI 希望通过这一新架构,获得更多资源以支持广泛的公共利益,同时确保 AI 的安全和对齐发展

https://openai.com/index/evolving-our-structure/

ScienceOne智能科研平台发布,助力科研全流程AI赋能

中国科学院自动化研究所联合多家单位共同研发的基于科学基础大模型的智能科研平台ScienceOne正式发布,平台包含S1-Literature文献助手和S1-ToolChain科学工具调度台两大产品。S1-Literature文献助手依托国内最大的科技文献数据库,可实现文献理解与综述自动生成,支持多学科领域知识问答等功能;S1-ToolChain科学工具调度台则实现了跨学科数据理解与科学计算工具的自主协同调用,已集成近300个科学分析工具

https://mp.weixin.qq.com/s/bq9immhhL5EIFbCprq2X7w

微软推出Phi-4推理模型系列,小模型实现大性能

微软AI实验室近日发布了Phi-4推理模型系列,包括Phi-4-reasoning、Phi-4-reasoning-plus和Phi-4-mini-reasoning。其中,Phi-4-mini-reasoning仅用3.8B参数便超越了8B参数的DeepSeek-R1蒸馏模型。该系列模型通过监督微调和少量强化学习(仅用6000样本)训练,不仅在AIME、HMMT等数学基准测试中表现优异,还展现出强大的推理迁移能力,能在未训练的任务中实现显著性能提升

https://www.microsoft.com/en-us/research/wp-content/uploads/2025/04/phi_4_reasoning.pdf

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

啥都生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值