基于网络搜索的长篇问答能力优化：FoRAG

最新推荐文章于 2024-06-29 12:54:28 发布

hanscalZheng

最新推荐文章于 2024-06-29 12:54:28 发布

阅读量342

点赞数 6

分类专栏：大语言模型文章标签：大语言模型 RAG 网络搜索

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43145427/article/details/139890739

版权

大语言模型专栏收录该内容

63 篇文章 4 订阅

订阅专栏

检索增强生成（RAG，Retrieval Augmented Generation）可以利用搜索引擎检索技术来提升长篇问答质量，因而在 QA 任务中广受欢迎。尽管有多种开源方法和网络增强的商业系统如 Bing Chat 出现，但生成长篇答案的事实性和逻辑清晰度两大难题仍未解决。FoRAG试图通过下面两个关键点来解决这些挑战。

首先提出了一种提纲增强的生成器，确保多方面答案生成逻辑清晰。

接着，开发了一种基于双重细粒度 RLHF 框架的事实性优化方法，该框架在不同粒度级别上进行自动评估和奖励建模，提高答案在事实性方面的表现。
在这里插入图片描述

1 提纲增强生成器

通过网络搜索引擎检索到相关的信息，在利用这些信息生成长答案之前，提纲增强生成器首先草拟一个组织模式和纲要，以生成逻辑更加清晰的回复。这样可以确保生成的答案能够涵盖问题的多个方面，并且逻辑结构清晰。

2 双重细粒度RLHF框架

引入了细粒度设计的自动评估和奖励建模两个核心步骤，自动评估的粒度包括全局级(Holistic)、句子级(Sentence-level)和子声明级(Subclaim-level)，奖励建模的粒度包括句子级(Sentence-level)和Token级(Token-level)。这种方法不仅减少了人工评估的高成本，允许在不同粒度层次上灵活优化事实性，进而在细粒度上提供了更密集的训练信号，提高了RLHF的可靠性。

3 结语

应用FoRAG方法优调 Llama2-7B-chat 后，得到的 FoRAG-L-7B 模型在连贯性、有用性和事实性三个指标上超越了 WebGPT-175B，且参数数量仅为后者的 1/24。轮廓增强生成器显著提高了答案的连贯性和有用性，而双重细粒度RLHF框架则显著提高了答案在事实性方面的表现。

PS: 欢迎大家扫码关注公众号^_，我们一起在AI的世界中探索前行，期待共同进步！

关注

6
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
基于网络搜索的长篇问答能力优化：FoRAG

应用FoRAG方法优调 Llama2-7B-chat 后，得到的 FoRAG-L-7B 模型在连贯性、有用性和事实性三个指标上超越了 WebGPT-175B，且参数数量仅为后者的 1/24。轮廓增强生成器显著提高了答案的连贯性和有用性，而双重细粒度RLHF框架则显著提高了答案在事实性方面的表现。PS: 欢迎大家扫码关注公众号，我们一起在AI的世界中探索前行，期待共同进步！
复制链接

扫一扫

专栏目录

hanscalZheng CSDN认证博客专家 CSDN认证企业博客

码龄6年

201: 原创

8713: 周排名

1万+: 总排名

48万+: 访问

: 等级

2606: 积分

355: 粉丝

555: 获赞

30: 评论

1656: 收藏

私信

关注

热门文章

分类专栏

最新评论

RASA3.X(二)--常见命令详解
2301_76844457: 请问为啥rasa init没有生成models文件夹啊
大规模语言模型--LLaMA 家族
hanscalZheng: 具体可以参考这个代码，里面有残差连接，https://github.com/huggingface/transformers/blob/v4.38.2/src/transformers/models/llama/modeling_llama.py#L212
大规模语言模型--LLaMA 家族
hanscalZheng: 你看得很仔细，这里的除操作是torch.rsqrt来完成的，你可以对比一下torch.sqrt和torch.rsqrt的区别
大规模语言模型--LLaMA 家族
这般女子: 还有一个问题，根据图中的模型结构，MLP的表达式不应是down（up（x）* SwiGLU(gate(x))）?
大规模语言模型--LLaMA 家族
这般女子: 请问一下，RMSNorm公式中是除以sigma，为啥代码实现中是乘sigma?

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。