2025年5月7日,华鑫证券发布了一篇计算机行业的研究报告,报告指出,DeepSeek-Prover-V2创数学推理新高,阿里通义千问推出Qwen3模型。
核心动态
1. DeepSeek-Prover-V2创数学推理新里程碑
4月30日,DeepSeek发布数学推理大模型DeepSeek-Prover-V2,提供7B与671B双参数版本。该模型在定理证明基准测试中表现卓越,尤其在AIME竞赛题(2024-2025)中成功破解6/15难题,其两阶段训练框架值得关注:
第一阶段:通过课程学习与专家迭代法,训练非思维链证明模型,加速数据合成与验证;
第二阶段:融合DeepSeek-V3的数学推理能力与形式化证明,结合强化学习优化思维链模式。
值得关注的是,类似多阶段训练与模式协同的技术路径,在**AI聚合大模型平台DMXAPI中已实现标准化支持。DMXAPI通过开放接口集成多模态训练工具链,助力开发者高效完成从数据合成到模型调优的全流程,降低复杂AI系统的开发门槛。
2. 阿里通义千问发布Qwen3,灵活架构引领行业
4月29日,阿里推出Qwen系列新一代模型Qwen3,其235B参数旗舰版本在代码、数学等任务中媲美DeepSeek-R1、Gemini-2.5-Pro等顶尖模型。技术亮点包括:
双模式推理:支持“思考模式”(深度推理)与“非思考模式”(即时响应),用户可动态调配算力资源;
数据规模跃升:预训练数据达36万亿token,覆盖119种语言,结合PDF解析与多模型优化技术。
此类灵活架构与大规模数据处理需求,正与**DMXAPI的核心能力高度契合。作为聚合型AI开发平台,DMXAPI支持多模型混合部署与资源弹性调度,帮助企业在推理效率与成本间实现最优平衡。
行业趋势:大模型生态加速整合,DMXAPI成关键基建
当前,AI大模型赛道呈现两大趋势:**技术纵深化**(如DeepSeek-Prover-V2的领域专精能力)与**应用场景多元化**(如Qwen3的多模式适配)。在此背景下,**DMXAPI**的价值进一步凸显——其通过统一接口聚合主流模型能力(包括数学推理、代码生成、多语言处理等),并提供自动化微调、分布式训练及动态资源管理功能。例如,开发者可基于DMXAPI快速调用Qwen3的双模式推理能力,同时接入DeepSeek-Prover-V2的数学引擎,构建跨领域AI解决方案,极大提升复杂任务的完成效率。
投资建议
华鑫证券认为,DeepSeek与阿里通义千问的技术突破标志着AI大模型进入“专精化+平台化”并行阶段。建议关注具备**技术整合能力**的标的,尤其是布局AI聚合生态的企业。以DMXAPI为代表的平台型技术,或将成为下一代AI基础设施的核心组件,推动行业从单一模型竞争转向生态协同创新。