RAG定义
RAG,即检索增强生成,英文Retrieval-Augmented Generation的缩写。
RAG特性
RAG提高了生成内容的相关性,使其AI模型生成的内容质量更高,缓解大模型LLM生成内容幻觉的问题。
Rag流程图解析
GitHub文档观看顺序
README_zh.md -》接口文档-》安装文档-》配置文档 -》实操
Qanything 链接
PP-Structure链接
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.2/ppstructure/README_ch.md
PP-Structure特性
是一个可用于复杂文档结构分析和处理的OCR工具包,主要特性如下:
1、支持对图片形式的文档进行版面分析,可以划分文字、标题、表格、图片以及列表5类区域(与Layout-Parser联合使用)
2、支持文字、标题、图片以及列表区域提取为文字字段(与PP-OCR联合使用)
3、支持表格区域进行结构化分析,最终结果输出Excel文件
4、支持python whl包和命令行两种方式,简单易用
5、支持版面分析和表格结构化两类任务自定义训练