谷歌公布一个可以让 AI 进行自我判断输出内容正确性的模型训练框架 ASPIRE

喜好儿网

于 2024-01-24 18:20:13 发布

阅读量546

点赞数 12

文章标签：深度学习机器学习人工智能 aigc ai 神经网络搜索引擎

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/heehelcom/article/details/135828771

版权

谷歌开发的ASPIRE训练框架通过引入可信度机制和自我评估学习，提升大语言模型的准确率，并使小模型经过微调后能自信预测。实验结果显示，小模型在特定场景下可超越大模型。

摘要由CSDN通过智能技术生成

谷歌开发了一款名为 ASPIRE 的训练框架，旨在增强人工智能（AI）模型的选择性预测能力。这款框架为模型引入了 “可信度” 机制，即模型会输出一系列答案，并为每个答案赋予一个正确概率评分。通过这种方式，ASPIRE 训练框架可以提高大语言模型的输出准确率，并使较小的模型经过微调后能够进行准确且有自信的预测。

ASPIRE 训练框架主要分为三个阶段：

首先是“特定任务调整”阶段，该阶段对已经接受过基础训练的大型语言模型进行深入训练，重点加强模型的预测能力。研究人员通过引入一系列可调参数，在特定任务的训练数据集上微调预训练语言模型，从而提高模型的预测性能，使其能够更好地解决特定问题。
第二阶段是 “答案采样”，在特定微调后，模型可以利用先前学习到的可调参数，为每个训练问题生成不同的答案，并创建用于自我评估学习的数据集，生成一系列可信度较高的答案。研究人员使用集束搜索（Beam Search）方法和 Rouge-L 算法来评估答案的质量，并将生成的答案及评分重新输入给模型，开启第三阶段。
第三阶段是 “自我评估学习”，研究人员为模型添加一组可调参数，专门用于提升模型的自我评估能力。该阶段的目标是让模型学会自己判断输出的答案准确性，从而在生成答案时附上答案的正确概率评分。

谷歌研究人员使用 CoQA、TriviaQA 和 SQuAD 三个问答数据集来验证 ASPIRE 训练框架的成果，结果显示经过 ASPIRE 调整的小模型表现远超更大的模型。这项实验结果也表明，经过适当调整，即使是较小的语言模型，在某些场景下也能超越大语言模型。

总的来说，ASPIRE 训练框架可以显著提升大语言模型的输出准确率，并使较小的模型经过微调后能够进行准确且有自信的预测。这一框架为 AI 模型引入了可信度机制，使其能够自我判断输出内容的正确性，从而在高风险决策类场合应用更加可靠。

关注

12
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。