第三课笔记

1、学习了RAG技术的定义。是一种结合检索和生成的技术。通过外部的知识库来增强LLMs的性能。具体来说,当模型需要生成文本或者回答问题时,它会先从一个庞大的文档集合中检索出相关的信息,然后利用这些检索到的信息来指导文本的生成,从而提高预测的质量和准确性。适用于问答系统、文档生成、智能助手等多个自然语言处理任务中。RAG模型的优势在于通用性强、可实现即时的知识更新,以及通过端到端评估方法提供更高效和精准的信息服务。

2、RAG的工作原理。RAG通过三个关键部分实现工作:检索、利用和生成。在检索阶段,系统会从文档集合中检索相关信息;在利用阶段,系统会利用这些检索到的信息来填充文本或回答问题;最后在生成阶段,系统会根据检索到的知识来生成最终的文本内容。

3、RAG的优化方法。嵌入优化、索引优化、查询优化、上下文管理、迭代检索、递归检索、自适应检索、LLM微调。

4、RAG和微调的区别。RAG为非参数记忆。利用外部的知识库实时更新,知识密集。但是依赖于外部知识库的质量和覆盖范围,并且以来大模型能力。微调是参数记忆,需要大量标注数据,针对特定的任务。局限在于需要大量的标注数据,对新任务适应性差。

5、茴香豆。给予LLMs的领域知识助手,是书生的开源大模型应用。应用场景为智能客服等。加载了知识库,包括实时更新的企业内部文档、专业技术文档等。前端可适配微信、飞书等,后端可适配书生浦语、ChatGPT等。

茴香豆的工作流包括预处理、拒答工作流、应答工作流。预处理之后会与DB比较、得分。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值