self-reasoning from baidu

最新推荐文章于 2024-09-15 17:22:56 发布

蒸土豆的技术细节

最新推荐文章于 2024-09-15 17:22:56 发布

阅读量211

点赞数 4

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39006282/article/details/141119213

版权

添加链接描述
思路很好理解。一般rag检索回来的文本都是直接rerank，拿top-k个扔进llm里，但是这里面仍然会有不相关文档，可能导致幻觉。现有的事实性and忠实性测试测不了这种问题。对这个问题，处理方法完全是依赖llm+rerank，尽可能把相关文档往前提。

我自己做rag时必加的一步就是相关性检测，但是只是yes or no的检测，而self-reasoning是带分析的检测，并且需要总结其中与query相关的信息，然后把这些信息作为llm的context，这就有点介于rag-fusion和普通rag之间了，不是直接得到子问题答案，也不是直接对着context输出答案，而是像做材料题一样，先摘出有用信息，再回答。

这种能力并非llm拥有的，即：不是针对某个query的特定context的信息总结，而是context可能只是与query的子query有关，这需要训练才能教会llm，因此他们用gpt4生成了2000条训练数据，微调llama2-7b和13b，结果很好，但是无法超过gpt4，因为微调数据就来自于gpt4。

这个方法坏的点在数据只能靠llm自己搞，这又导致数据上限被卡住，人工写又不符合llm生成风格和逻辑。但是至少能改善现状。

虽然如此，但是现阶段效果比self-rag好。

蒸土豆的技术细节

关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

蒸土豆的技术细节 CSDN认证博客专家 CSDN认证企业博客

码龄7年

86: 原创

4万+: 周排名

2万+: 总排名

7万+: 访问

: 等级

1600: 积分

207: 粉丝

266: 获赞

22: 评论

333: 收藏

私信

关注

热门文章

最新评论

钓鱼大模型，让它输出不该输出的东西
CSDN-Ada助手: 不知道 MySQL入门技能树是否可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
如何通过大模型生成业务需要的数据集
蒸土豆的技术细节: 是每个二级标签依靠搜索找1000条相近种子，种子说不准有多少标签。提示词就是图片里的样子。
如何通过大模型生成业务需要的数据集
soybean1989: 您好，我想问下，他这个数据在生成的时候是每条种子数据对应多条提示词吗，他的提示词构建工程是怎么搞得没看懂
奇怪的错误记录
太平洋的矿泉水: 终于在这里找到了完美解决方案
奇怪的错误记录
老爹@: 这是一篇高质量的好文，深度理解和清晰的表达方式使复杂的技术概念变得容易理解，值得收藏点赞。博主用心很有耐心，更有对知识的热忱和热爱，写了这么实用有效的分享，期盼博主能够光顾我的博客，给予宝贵的指导！

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。