昆仑万维Skywork-OR1凭32B硬刚DeepSeek 671B，彻底开源，免费商用

最新推荐文章于 2025-05-01 22:59:55 发布

人工智能大模型讲师培训咨询叶梓

最新推荐文章于 2025-05-01 22:59:55 发布

阅读量543

点赞数 7

分类专栏： AI前沿人工智能文章标签：人工智能 DeepSeek-R1 大模型微调编程代码生成数学推理 AI

本文链接：https://blog.csdn.net/weixin_44292902/article/details/147224208

版权

人工智能同时被 2 个专栏收录

309 篇文章

订阅专栏

AI前沿

104 篇文章

订阅专栏

想要掌握如何将大模型的力量发挥到极致吗？叶梓老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具（限时免费）。

1小时实战课程，您将学习到如何轻松上手并有效利用 Llama Factory 来微调您的模型，以发挥其最大潜力。

CSDN教学平台录播地址：https://edu.csdn.net/course/detail/39987

想快速掌握自动编程技术吗？叶老师专业培训来啦！这里用Cline把自然语言变代码，再靠DeepSeek生成逻辑严谨、注释清晰的优质代码。叶梓老师视频号上直播分享《用deepseek实现自动编程》限时回放。

视频号（直播分享）：sphuYAMr0pGTk27 抖音号：44185842659

在人工智能领域，大模型的发展日新月异，不断推动着技术的边界。Skywork-OR1 系列模型作为一款开源的高性能推理模型，以其卓越的数学和代码推理能力，以及彻底的开源策略，引起了广泛关注。

Skywork-OR1 系列模型由昆仑万维天工团队开发，旨在通过大规模规则强化学习，利用精心设计的数据集和训练方案，提升模型在数学和代码推理方面的性能。该系列包括两个通用推理模型——Skywork-OR1-7B-Preview 和 Skywork-OR1-32B-Preview，以及一个专注于数学领域的专项模型 Skywork-OR1-Math-7B。

在评估模型性能方面，Skywork-OR1 系列采用了创新的 Avg@K 指标，而非传统的 Pass@1 指标。Avg@K 指标通过测量模型在 K 次独立尝试中的平均表现，减少了随机性的影响，增强了结果的可靠性。这种评估方式更能够反映模型的稳定性和推理一致性。

上图展示了 Skywork-OR1 系列模型在 AIME24、AIME25 和 LiveCodeBench 数据集上的性能表现。通过 Avg@K 指标，我们可以看到 Skywork-OR1-32B-Preview 在数学推理任务中表现优异，与参数规模高达 671B 的 DeepSeek-R1 模型持平，展现了其卓越的性价比。

Skywork-OR1 系列模型采取了彻底的开源策略，全面开放了模型权重、训练数据集和完整训练代码。这种透明度极高的开源方式，不仅为开发者社区提供了宝贵的资源，也促进了技术的共享和进步。目前，相关资源已上传至 GitHub 和 Huggingface 平台，方便开发者获取和使用。

昆仑万维计划在两周内发布 Skywork-OR1 系列模型的正式版本，并推出更为系统详尽的技术报告。技术报告将深入分享模型的训练方法、数据处理流程以及关键技术发现，为社区提供完全可复现的实践参考。

https://github.com/SkyworkAI/Skywork-OR1