Semi-Instruct: Bridging Natural-Instruct and Self-Instruct for Code Large Language Models

本文提出半指导(Semi-Instruct)方法,旨在结合自然指令(Natural-Instruct)和自我指令(Self-Instruct)的优势,用于代码大型语言模型(Code-LLM)的指令调优。自然指令存在多种正确代码但缺乏指令-代码对,而自我指令虽能自动生成配对数据,但多样性不足。半指导通过转换自然指令生成适当的指令-代码对,并通过构建测试用例验证代码正确性。实验显示,半指导方法在性能上显著优于单独使用自然指令或自我指令,并且随着数据规模增加,性能持续提升。
摘要由CSDN通过智能技术生成

本文是LLM系列文章,针对《Semi-Instruct: Bridging Natural-Instruct and Self-Instruct for Code
Large Language Models》的翻译。

半指导:连接代码大型语言模型的自然指导和自我指导

摘要

指令调优在用于程序合成任务的代码大型语言模型(Code-LLM)中起着关键作用。目前,收集调优数据的两种主要范式是自然指令(人工编写)和自我指令(自动生成)。自然指令包含多种正确的代码,但缺乏指令-代码对,并且存在嵌套单行代码等不正确的代码格式。相反,自我指示会自动生成正确的配对数据。然而,由于生成重复,它的多样性较低,无法确保代码的正确性。为了连接这两种范式,我们提出了半指导。它首先通过一种类似于自指令的方法将不同但不适当的代码从自然指令转换为适当的指令-代码对。为了验证生成代码的正确性,我们设计了一种新的方法来构建测试用例,通过生成用例的输入,并根据自然指令执行正确的代码来获得输出。最后,为了进行指令调优,保留了多种正确的指令代码对。实验表明,半指导显著优于自然指导和自我指导。此外,随着数据规模的增加,性能稳步提高。我们的代码和数据将公开。

1 引言

2 相关工作

<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值