Kimi K1.5 究竟有多牛？5大技术突破让你大吃一惊！

最新推荐文章于 2025-05-23 10:18:27 发布

多森AI

最新推荐文章于 2025-05-23 10:18:27 发布

阅读量2k

点赞数 18

文章标签：人工智能 AIGC

本文链接：https://blog.csdn.net/weixin_43740553/article/details/145380313

版权

你是否曾为冗长的报告和海量的数据分析而头疼？

是否曾希望AI能像人类一样理解图像和文字背后的深层含义？

人工智能正在以超乎想象的速度发展，而国产AI领域最近传来重磅消息：Kimi发布了新一代多模态大模型K1.5，在多项测试中表现出色，直逼OpenAI的o1！

这究竟是怎样一款强大的模型？一起来看看！

硬核技术，实力说话

Kimi K1.5究竟有哪些过人之处？我们来划重点：

长上下文扩展

Kimi K1.5 将强化学习的上下文窗口扩展至 128k，通过部分展开（Partial Rollouts）技术显著提高了训练效率。这一技术通过重用先前的轨迹片段来生成新的轨迹，避免了从头生成完整轨迹的高计算成本。随着上下文长度的增加，模型在复杂推理任务上的表现持续提升，为解决更复杂的推理问题奠定了基础。

改进的策略优化

Kimi K1.5 采用了基于长链思维（Long-CoT）的强化学习公式，并结合在线镜像下降法（Online Mirror Descent）的变体进行策略优化。通过有效的采样策略、长度惩罚和数据配方优化，进一步提升了算法的性能。这一改进不仅提升了模型的表现，还为大规模 AI 模型向更复杂的任务挑战迈进了一步。

简洁的框架

Kimi K1.5 的设计摒弃了复杂的蒙特卡洛树搜索、价值函数和过程奖励模型等技术，是通过扩展上下文长度和优化策略，实现了强大的推理能力。使模型在长上下文推理中表现出色，同时具备规划、反思和修正的能力。

多模态能力

Kimi K1.5 在文本和视觉数据上进行了联合训练，能同时处理文本和视觉信息，具备跨模态推理的能力。在多个基准测试中，Kimi K1.5 的多模态推理能力表现出色，例如在 MathVista 测试中达到 74.9 的通过率。

Long2Short 技术

Kimi K1.5 提出了一种将长链思维模型的推理能力迁移到短链思维模型的方法，包括模型融合、最短拒绝采样、DPO（成对偏好优化）和 Long2Short RL（强化学习）。这些方法显著提高了短链推理模型的性能和 Token 效率。

性能炸裂，硬刚OpenAI

光说不练假把式！Kimi K1.5在多项权威测试中表现优异，甚至可以和OpenAI的o1正面PK！

数学推理测评

AIME 2024 测试：在 AIME 2024 测试中，Kimi K1.5 的 Long-CoT 模式达到了 77.5 的通过率，Short-CoT 模式也达到了 60.8 的通过率。
MATH-500 测试：在 MATH-500 测试中，Kimi K1.5 的 Long-CoT 模式取得了 96.2 的准确率，Short-CoT 模式也有 94.6 的准确率。