腾讯云向量数据库-RAG介绍

1.说明

RAG结合LLM(通用大预言模型)构件基于私有文档、专业领域知识、实时信息的charbot。

2.RAG的主要步骤

  • 知识切片成chunk
  • 向量化chunk入库
  • query检索知识chunk
  • 构件prompts
  • 调用llm生成回答

3.优势

  • 快速构件demo
  • 快速理解rag
  • 社区支持

4.痛点

  • 投入大
  • 效果差
  • 调优难

5.RAG应用的效果

整体效果=文档处理效果*embedding效果*retrieval效果*LLM效果

6.数据处理的难点:解析和拆分

1.PDF格式的多样性(eg:标准格式、跨页表格、离散等),会有复杂多变的文档格式,提高效果的困难度。

解决办法:

2.文档内容质量将很有程度影响最终效果。

  • 6
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值