IBM请求出战——Granite Code模型正式开源

IBM 最近发布了一组名为"Granite Code"的开源型,旨在帮助企业完成各种软件开发任务,并在基准测试中表现出色。这些模型不仅过了一些较大的开源竞争对手,而且在编程任务中展现出了强大的性能。

Granite Code 型分为基础模型和指导模型,每种模型都有四个不同规模的变种,参数数量从30到340亿不等。这些模型的上下文窗口相对较短,例如,其中一个模型的上下文窗口只有128K,这限制了其在包含特定文档或自己的代码库等提示信息时的有效性。不过,IBM 目正在开发具有更大上下文窗口的版本。

基础模型的训练分为两个阶段。第一阶段使用自116种编程语言的3-4万亿个标记进行训练,以建立广泛的理解能力。在第阶段,这些模型使用来自高质量代码和自然语言数据的5000亿个标记进行进一步训练,以强逻辑推理能力。

指导模型是通过对基础模型进行改进而创建的,改进方法包括筛选提交记录、自然语言指令记录和合成生成的代码数据集。

在包括代码合成、调试、解释、编辑、学推理等多个基准测试中,Granite Code 模型在各个规模和基准测试中表现出色,常常超过开源模型两倍以上的大小。例如,在 HumanEvalPack 基准测试中,Granite-8B-Code-Base 的平均得为33.2%,超过Google最佳表现的 CodeGemma-8B 模型的21.3%,尽管 Granite-8-Code-Base 所使用的标记数量明显较少。

这些模型的大部分训练数据来自一个清理过的 GitHub 集 StarCoderData 和其他公开可用的代码库。这一点非常重要,因为目前有一些关于其他代码型(包括 GitHub 本身)涉嫌侵犯训练数据版权的诉讼。

IBM 计划定期更新这些模型,很快将推出具有更大上下文窗口以及针对 Python 和 Java 的专业化版本。这些模型已经在 Hugging FaceGitHub 上可用,并且也是 IBM 的 watsonx 企业平台的一部分。

IBM 的 Granite Code 是一专门用于编程的开源模型,它们在基准测试中表现优异,同时具有较少的参数数量。些模型的特点包括灵活的规模选择、基于广泛训练数据的逻辑推理能力和良好的性能未来,IBM 还计划不断改进和更新这些模型,以满足不同编程任务的需求。

在这里插入图片描述

对一组综合任务的评估表明,这些 Granite 代码模型始终与当前可用的开源代码 LLM 中的最新性能相匹配。多功能模型系列针对企业软件开发工作流程进行了优化,在一系列编码任务(包括代码生成、修复和解释)中表现良好。

这些模型可在 Hugging Face、GitHub、watsonx.ai 和 RHEL AI 上使用,RHEL AI 是红帽用于开发、测试和部署生成式 AI 模型的新基础模型平台。基础代码模型与用于为专用域训练 WCA 的模型相同。

所有模型都根据收集的数据进行了训练,这些数据是按照 IBM 的 AI 道德原则和 IBM 法律团队的指南收集的,以便值得信赖的企业使用。这些Granite Code模型今天在Apache 2.0许可下发布。

模型的性能

在与一系列其他模型(包括那些在 Apache 2.0 许可下开放的模型)和更多专有模型的测试中,我们发现我们的模型能够在一系列任务中竞争。在包括 HumanEvalPack、HumanEvalPlus 和 RepoBench 在内的基准测试中,我们看到了大多数主要编程语言(包括 Python、JavaScript、Java、Go、C++ 和 Rust)在代码合成、修复、解释、编辑和翻译方面的出色表现。

在这里插入图片描述

ModelMATHGSM8KSATOCWMATH+PyGSM8K+Py
StarCoderBase-7B2.43.818.72.218.215.6
CodeLlama-7B4.111.912.52.920.826.8
StarCoder2-7B10.427.237.54.828.739.4
CodeGemma-7B21.849.053.16.931.160.9
Granite-8B-Code-Base21.461.962.58.835.463.1
Gemma-7B24.153.375.07.327.452.9
Mistral-7B-v0.212.837.253.15.825.745.6
Llama-3-8B15.649.834.49.90.0*2.4
Lemma-7B17.333.759.47.025.640.8
  • 13
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值