研究动机 指令微调是一个LLM重要的步骤,但是标注数据是一个非常大的开销;因此作者想要开发一种自动标注数据集的方法;也就生成一个问答和答案对应的数据集 研究方法 作者首先从文字段当中生产一些问题: 之后从文字段当中找出一些答案(作者提供了非常丰富的prompt) 训练模型自动完成 作者使用 Mistral-7B训练一个网络自动完成这个任务。