第三课笔记

最新推荐文章于 2024-08-19 11:19:25 发布

hemaerika

最新推荐文章于 2024-08-19 11:19:25 发布

阅读量180

点赞数 2

文章标签：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hemaerika/article/details/139637984

版权

1、学习了RAG技术的定义。是一种结合检索和生成的技术。通过外部的知识库来增强LLMs的性能。具体来说，当模型需要生成文本或者回答问题时，它会先从一个庞大的文档集合中检索出相关的信息，然后利用这些检索到的信息来指导文本的生成，从而提高预测的质量和准确性。适用于问答系统、文档生成、智能助手等多个自然语言处理任务中。RAG模型的优势在于通用性强、可实现即时的知识更新，以及通过端到端评估方法提供更高效和精准的信息服务。

2、RAG的工作原理。RAG通过三个关键部分实现工作：检索、利用和生成。在检索阶段，系统会从文档集合中检索相关信息；在利用阶段，系统会利用这些检索到的信息来填充文本或回答问题；最后在生成阶段，系统会根据检索到的知识来生成最终的文本内容。

3、RAG的优化方法。嵌入优化、索引优化、查询优化、上下文管理、迭代检索、递归检索、自适应检索、LLM微调。

4、RAG和微调的区别。RAG为非参数记忆。利用外部的知识库实时更新，知识密集。但是依赖于外部知识库的质量和覆盖范围，并且以来大模型能力。微调是参数记忆，需要大量标注数据，针对特定的任务。局限在于需要大量的标注数据，对新任务适应性差。

5、茴香豆。给予LLMs的领域知识助手，是书生的开源大模型应用。应用场景为智能客服等。加载了知识库，包括实时更新的企业内部文档、专业技术文档等。前端可适配微信、飞书等，后端可适配书生浦语、ChatGPT等。

茴香豆的工作流包括预处理、拒答工作流、应答工作流。预处理之后会与DB比较、得分。

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
第三课笔记

具体来说，当模型需要生成文本或者回答问题时，它会先从一个庞大的文档集合中检索出相关的信息，然后利用这些检索到的信息来指导文本的生成，从而提高预测的质量和准确性。RAG模型的优势在于通用性强、可实现即时的知识更新，以及通过端到端评估方法提供更高效和精准的信息服务。最后在生成阶段，系统会根据检索到的知识来生成最终的文本内容。4、RAG和微调的区别。RAG为非参数记忆。加载了知识库，包括实时更新的企业内部文档、专业技术文档等。嵌入优化、索引优化、查询优化、上下文管理、迭代检索、递归检索、自适应检索、LLM微调。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。