RAFT：Adapting Language Model to Domain Specific RAG

最新推荐文章于 2024-11-04 22:31:49 发布

蒸土豆的技术细节

最新推荐文章于 2024-11-04 22:31:49 发布

阅读量267

点赞数 1

文章标签：语言模型人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39006282/article/details/141543646

版权

论文链接
简单来说，就是你SFT微调的时候得考虑RAG的场景。
RAG什么场景？你检索top-k回来，里面有相关doc有不相关doc，后者是影响性能的重要原因，LLM需要有强大的识别能力才能分得清哪块和你的query相关。微调就是为了这个。你做领域微调时，根据chunk生成query、answer，然后直接拿这仨微调，这里面没有干扰项，没有“不相关doc”，就扛不住RAG的噪声。

RAFT就是针对这个搞的。怎么搞？就是chunk query answer里，chunk再多加几个不相关文档，并且answer生成时使用CoT，CoT其实是选用，用了，效果好，不用，推理速度快。

混合多少不相关文档，得你自己凭经验。

蒸土豆的技术细节

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。