一、核心使用流程
所有文档加载器均遵循统一的「两步调用法」:
-
实例化加载器
- 配置路径参数:文件路径/目录路径/URL等
- 设置解析参数:字段指定/编码格式/分隔符等
-
执行加载操作
documents = loader.load() # 返回标准化的Document对象列表
二、主流加载器参数配置
不同加载器通过参数定制化实现差异化处理:
- CSV 文件解析
CSVLoader(
file_path = "data.csv",
csv_args = {
"delimiter": ",", # 分隔符
"fieldnames": ["id","content"], # 指定解析列
"source_column": "来源" # 元数据来源标识
}
)
- 目录批量处理
DirectoryLoader(
path = "./docs", # 根目录路径
glob = "**/*.txt", # 文件匹配模式
loader_cls=TextLoader # 指定基础加载器
)
- JSON 结构化提取
JSONLoader(
file_path = "data.json",
jq_schema = ".results[]", # JSONPath查询语句
content_key = "text" # 内容字段定位
)
三、文档标准化规范
所有加载器输出均符合:
- 统一返回List[Document]数据结构
- Document对象包含:
1.page_content: 解析后的文本内容
2.metadata: 来源/创建时间等元信息
3.差异点体现在metadata字段的丰富程度
四、Markdown 文档加载器
Markdown 是一种轻量级标记语言,可用于使用纯文本编辑器创建格式化文本。例如课程的电子书就是 Markdown 格式文件。
LangChain 中封装了一个 UnstructuredMarkdownLoader 对象,要使用这个加载器,必须安装 unstructured 包,安装命令:
pip install unstructured
unstructured 包是一款开源非结构化数据的预处理工具,旨在简化和优化结构化和非结构化文档的预处理,并且内置了用于读取和预处理图像和文本文档(如 PDF、HTML、Word 文档等)的开源组件。
也是 LangChain 文档加载器的核心(绝大部分加载器都基于 unstructured 包进行开发+封装)。
安装好 unstructured 包后,就可以和文本加载器一样,直接传递 Markdown 文档的路径,如下:
from langchain_community.document_loaders import UnstructuredMarkdownLoader
loader = UnstructuredMarkdownLoader("./文档(资料).md")
documents = loader.load()
print(documents)
UnstructuredMarkdownLoader 默认会将整个文件加载到文档中,加载得到的文档列表只有一个元素,在这个元素的 page_content 中记录了整个 Markdown 文档的所有内容。
其实在幕后 unstructured 包的处理中,已经为不同的文本块创建了不同的“元素”,默认情况下是全部结合到一起的,但是可以通过传递参数 mode=“elements” 让所有元素全部分离。
分离代码示例:
from langchain_community.document_loaders import UnstructuredMarkdownLoader
loader = UnstructuredMarkdownLoader("./文档(资料).md", mode="elements")
documents = loader.load()
print(f"文档数量: {len(documents)}")
for document in documents[:2]:
print(document)
输出内容:
文档数量: 72
page_content='文档' metadata={'source': './文档(资料).md', 'last_modified': '2024-07-05T10:41:07', 'page_number': 1, 'languages': ['eng'], 'filetype': 'text/markdown', 'file_directory': '.', 'filename': '文档(资料).md', 'category': 'Title'}
page_content='应用 API 接口统一以 JSON 格式返回,并且包含 3 个字段:code、data 和 message,分别代表业务状态码、业务数据和接口附加信息。' metadata={'source': './文档(资料).md', 'last_modified': '2024-07-05T10:41:07', 'page_number': 1, 'languages': ['eng'], 'parent_id': 'b7210d8e5b8b15feccc935fd705f763b', 'filetype': 'text/markdown', 'file_directory': '.', 'filename': '文档(资料).md', 'category': 'NarrativeText'}
但是一般在加载文件为文档时,很少对文档进行相应的拆分操作,在文档加载器中执行分割没法保证操作的一致性(没法确保所有传递文档分割的统一性,分割出来的文档块大小不一,使用不便)。
五、Office 文档加载器
除了 Markdown 文档,另外一种高频使用的数据就是 Office 文档,在 LangChain 中也基于 unstructured 包封装了对应的文档加载器—— UnstructuredExcelLoader、UnstructuredPowerPointLoader、UnstructuredWordDocumentLoader。
分别对应 Excel、PPT、Word 文档加载器,其中不同的加载器需要安装不同的 Python 包,命令如下:
# UnstructuredExcelLoader加载器所需包
pip install unstructured openpyxl pandas
# UnstructuredPowerPointLoader加载器所需包
pip install unstructured python-magic python-pptx
# UnstructuredWordDocumentLoader加载器所需包
pip install unstructured python-docx
Office 类的非结构化文档加载器使用技巧都非常简单,一般来说,传递对应文档的路径即可,如果需要区分文档中的元素,可以在加载器的构造函数中传递 mode=“elements” 即可(但是一般不使用)。
示例如下:
from langchain_community.document_loaders import (
UnstructuredExcelLoader,
UnstructuredPowerPointLoader,
UnstructuredWordDocumentLoader,
)
excel_loader = UnstructuredExcelLoader("./员工考勤表.xlsx")
ppt_loader = UnstructuredPowerPointLoader("./章节介绍.pptx", mode="elements")
word_loader = UnstructuredWordDocumentLoader("./喵喵.docx")
documents = ppt_loader.load()
print(documents)
print(len(documents))
print(documents[0].page_content)
输出内容:
[Document(page_content='LangChain RAG应用开发组件深入学习', metadata={'source': './章节介绍.pptx', 'category_depth': 1, 'file_directory': '.', 'filename': '章节介绍.pptx', 'last_modified': '2024-07-20T11:44:28', 'page_number': 1, 'languages': ['zho', 'kor'], 'filetype': 'application/vnd.openxmlformats-officedocument.presentationml.presentation', 'category': 'Title'}), Document(page_content='章节介绍', metadata={'source': './章节介绍.pptx', 'category_depth': 1, 'file_directory': '.', 'filename': '章节介绍.pptx', 'last_modified': '2024-07-20T11:44:28', 'page_number': 1, 'languages': ['zho', 'kor'], 'filetype': 'application/vnd.openxmlformats-officedocument.presentationml.presentation', 'category': 'Title'})]
17
LangChain RAG应用开发组件深入学习
利用 unstructured 包提供的办公文档加载能力,配合 LLM 可以实现 2023 年爆火的 ChatPDF 功能,即上传特定的 PDF,让 LLM 实现对指定的 PDF 的问答功能。
六、URL 网页加载器
除了本地文件,LangChain 还封装了大量加载网络文件的加载器,例如:网页加载器、腾讯云 COS 对象存储加载器、Bilibili 字幕加载器、Notion 数据库加载器等,使用技巧和文件加载器大差不差,传递对应的信息构建加载器,然后加载文档即可。
例如如果想加载获取 慕课网 网站首页的数据,即可使用 WebBaseLoader 一键加载,示例如下:
from langchain_community.document_loaders import WebBaseLoader
loader = WebBaseLoader("https://imooc.com")
documents = loader.load()
print(documents)
输出内容:
[Document(page_content='\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n \n\n\n\n\n\n\n\n\n\n\n\n\n登录 / 注册\n\n免费课\n\n\n实战课\n\n体系课\n成长课\n\n发现\n\n教程\n专栏\n手记\n\n\n\n\n商业合作\n\n企业服务\n讲师入驻\n\n\n\n\n\n\n\n\n\n\n\n\n 搜索\n\t\t \n\n\n\n热搜\n\n\n\n\n最近搜索清空\n\n\n\n\n\n\n\n\n\n\n\n\n0\n\n\n\n\n\n\n登录 / 注册\n\n\n 新人专属元礼包 | 查看\ue5cd\n\n\n\n\n\n\n 为了账号安全,请及时绑定邮箱和手机立即绑定 \n\n \n\n\n前沿技术\n\n\n\n前沿技术:\n\n机器学习\nChatGPT\nAI语音\n人工智能\n微服务\n区块链\n以太坊\n深度学习\n计算机视觉\nNLP自然语言处理\n数据分析&挖掘\n\n\n\n云计算&大数据:\n\n大数据\nHadoop\nSpark\nHbase\nFlink\nStorm\n云计算\nAWS\nDocker\nKubernetes\n\n\n\n\n\n\n\n\n\n\nAI人工智能算法工程师\n体系\n\n\n\n优惠价\n¥3699.00 ·\n \n 零基础\n ·\n 376\n\n\n\n\n\n\n\n\n\nLLM行业领军大佬 带你转型大语言模型算法工程师\n体系\n\n\n\n优惠价\n¥2999.00 ·\n \n ·\n 197\n\n\n\n\n\n\n\n\n\n从0到1训练私有大模型 ,企业急迫需求,抢占市场先机\n实战\n\n\n\n299.00 ·\n \n 中级\n ·\n 519\n\n\n\n\n\n\n\n\n\nAI小白入学&求职指南\n\n\n\n免费 ·\n \n 入门\n ·\n 5960\n\n\n\n\n\n\n\n前端开发\n\n\n\n知识点:\n\nVue.js\nTypescript\nReact.JS\nHTML/CSS\nJavaScript\nAngular\nNode.js\njQuery\nBootstrap\nSass/Less\nWebApp\n小程序\n前端工具\nCSS\nHtml5\nCSS3\n\n\n\n\n\n\n\n\n\n\n 前端工程师 \n体系\n\n\n\n优惠价\n¥5199.00 ·\n \n 零基础\n ·\n 385\n\n\n\n\n\n\n\n\n\nReact18 系统入门 进阶实战《欢乐购》\n实战\n\n\n\n299.00 ·\n \n 中级\n ·\n 303\n\n\n\n\n\n\n\n\n\n前端必学 40个精选案例实战 从零吃透HTML5+CSS3+JS\n实战\n\n\n\n599.00 ·\n \n 入门\n ·\n 273\n\n\n\n\n\n\n\n\n\n手把手带你前端快速入门\n\n\n\n免费 ·\n \n 入门\n ·\n 4144\n\n\n\n\n\n\n\n后端开发\n\n\n\n知识点:\n\nJava\nSpring Cloud\nSSM\nPHP\n.net\nPython\n爬虫\nDjango\nFlask\nTornado\nGo\nC\nC++\nC#\nRuby\nThinkPHP\n\n\n\n\n\n\n\n\n\n\nJava高级工程师\n体系\n\n\n\n优惠价\n¥2488.00 ·\n \n 进阶\n ·\n 387\n\n\n\n\n\n\n\n\n\nGo开发工程师全新版\n体系\n\n\n\n优惠价\n¥3288.00 ·\n \n 进阶\n ·\n 464\n\n\n\n\n\n\n\n\n\n新版Springboot3.0打造能落地的高并发仿12306售票系统\n实战\n\n\n\n讲师宠粉福利\n¥439.00 ·\n \n 中级\n ·\n 738\n\n\n\n\n\n\n\n\n\n7种设计原则+3个实战案例,带你初探Java 设计模式\n\n\n\n免费 ·\n \n 初级\n ·\n 2719\n\n\n\n\n\n\n\n移动开发\n\n\n\n知识点:\n\n鸿蒙\nAndroid\niOS\nReact native\nWEEX\nSwift\n\n\n\n\n\n\n\n\n\n\n鸿蒙NEXT应用开发工程师\n体系\n\n\n\n优惠价\n¥3699.00 ·\n \n ·\n 47\n\n\n\n\n\n\n\n\n\nRN从0到1系统精讲与小红书APP实战\n实战\n\n\n\n讲师宠粉福利\n¥519.00 ·\n \n 中级\n ·\n 256\n\n\n\n\n\n\n\n\n\nChatGPT + Flutter快速开发多端聊天机器人App\n实战\n\n\n\n讲师宠粉福利\n¥399.00 ·\n \n 中级\n ·\n 296\n\n\n\n\n\n\n\n\n\nuni-app 快速入门,打造3端在线教育类app\n\n\n\n免费 ·\n \n 初级\n ·\n 4941\n\n\n\n\n\n\n\n计算机基础\n\n\n\n计算机基础:\n\n算法与数据结构\n密码学\n信息安全\n计算机网络\n数学\n\n\n\n数据库:\n\nMySQL\nRedis\nMongoDB\nOracle\nSQL Server\nNoSql\n\n\n\n\n\n\n\n\n\n\n算法大师之路\n体系\n\n\n\n优惠价\n¥1799.00 ·\n \n 进阶\n ·\n 42\n\n\n\n\n\n\n\n\n\n算法与数据结构\n体系\n\n\n\n优惠价\n¥999.00 ·\n \n 进阶\n ·\n 2553\n\n\n\n\n\n\n\n\n\n算法与数据结构高手养成-求职提升特训课\n实战\n\n\n\n讲师宠粉福利\n¥1129.00 ·\n \n 中级\n ·\n 284\n\n\n\n\n\n\n\n\n\n嵌入式底层开发必备-计算机微机原理与接口技术\n\n\n\n免费 ·\n \n 入门\n ·\n 2410\n\n\n\n\n\n\n\n测试运维\n\n\n\n知识点:\n\n运维\n自动化运维\n运维工具\n中间件\nLinux\n测试\n功能测试\n性能测试\n自动化测试\n接口测试\n安全测试\n\n\n\n\n\n\n\n\n\n\n全能软件测试工程师\n体系\n\n\n\n优惠价\n¥2488.00 ·\n \n 零基础\n ·\n 301\n\n\n\n\n\n\n\n\n\nSelenium3+Pytest+Allure 全流程实战自动化测试\n实战\n\n\n\n299.00 ·\n \n 中级\n ·\n 546\n\n\n\n\n\n\n\n\n\nWeb安全渗透测试 掌握绝大多数Web漏洞原理及攻防手段\n实战\n\n\n\n799.00 ·\n \n 入门\n ·\n 225\n\n\n\n\n\n\n\n\n\n【新版】程序员2天快速入门Linux\n\n\n\n免费 ·\n \n 入门\n ·\n 7633\n\n\n\n\n\n\n\n更多方向\n\n\n\n知识点:\n\n模型制作\n动效动画\n设计基础\n设计工具\nAPPUI设计\n产品交互\nPhotoshop\n\n\n\n\n\n\n\n\n\n\n产品经理体系课\n体系\n\n\n\n优惠价\n¥1588.00 ·\n \n 零基础\n ·\n 639\n\n\n\n\n\n\n\n\n\n国家级认证 信息系统项目管理师(软高)一站式通关课程\n实战\n\n\n\n讲师宠粉福利\n¥789.00 ·\n \n 高级\n ·\n 156\n\n\n\n\n\n\n\n\n\n互联网人副业指南 传授思维与方法 启动你的首个项目\n实战\n\n\n\n讲师宠粉福利\n¥699.00 ·\n \n 初级\n ·\n 343\n\n\n\n\n\n\n\n\n\nweb3.0-区块链 入门指南\n\n\n\n免费 ·\n \n 入门\n ·\n 6017\n\n\n\n\n\n\n\n前沿技术:\n人工智能 / AIGC / 大模型\n\n\n\n前端开发:\nHTML5 / Vue.js / Node.js\n\n\n\n后端开发:\nJava / Python / Go\n\n\n\n移动开发:\nFlutter / Android / iOS \n\n\n\n计算机基础:\n算法 / 数学 / 数据库\n\n\n\n测试运维:\n自动化测试 / 容器\n\n\n\n更多方向:\n产品设计 / UI设计 / 游戏\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n AI人工智能 AIGC | ChatGPT | LLM AI算法工程师 AI+AIGC+大模型 LLM应用开发平台 可商用大模型丨LLMOps 商业数据分析师 数据分析技能一站式搞定 Python工程师 全能人才的首选 体系课 more 推荐 人工智能 前端开发 后端开发 精品免费 数据分析思维实战课-人人都能用得上 初级 · 8人报名 上新特惠 ¥99.00 ¥129.00 高性能GO企业级APM监控系统实战 中级 · 22人报名 上新特惠 ¥269.00 ¥299.00 SpringCloud+Netty集群实战千万级 IM系统 中级 · 162人报名 上新特惠 ¥299.00 ¥348.00 2024 Java 高分面试宝典 一站式搞定技术面+项目面 中级 · 74人报名 上新特惠 ¥269.00 ¥299.00 C++大型流媒体项目-从底层到应用层千万级直播系统实战 中级 · 100人报名 上新特惠 ¥339.00 ¥399.00 2024,Python爬虫系统入门与多领域实战 初级 · 71人报名 上新特惠 ¥169.00 ¥199.00 从0到1全流程落地web游戏大地图项目,成为WebGlS专家 入门 · 69人报名 上新特惠 ¥169.00 ¥199.00 专为立志成为 10倍+ 效能职场跃迁的程序员设计 初级 · 44人报名 上新特惠 ¥169.00 ¥199.00 专为立志成为 10倍+ 效能职场跃迁的程序员设计 初级 · 44人报名 上新特惠 ¥169.00 ¥199.00 AI全流程落地实战 从设计-开发-测试到运营一站式搞定 初级 · 179人报名 上新特惠 ¥269.00 ¥299.00 AI多领域爆文写作与个人IP变现全流程实战 初级 · 85人报名 助学计划 ¥68.00 ¥99.00 AI Agent智能应用从0到1定制开发 全流程解决方案实战 中级 · 765人报名 ¥368.00 从0到1全流程落地web游戏大地图项目,成为WebGlS专家 入门 · 69人报名 上新特惠 ¥169.00 ¥199.00 前端全栈进阶 Nextjs打造跨框架SaaS应用 中级 · 155人报名 ¥299.00 前端跳槽突围课,React18底层源码深入剖析 高级 · 63人报名 ¥399.00 低代码全栈项目实战 商业级海报编辑器全流程落地 中级 · 48人报名 讲师宠粉福利 ¥1199.00 ¥1299.00 SpringBoot2 仿B站高性能前端+后端项目 初级 · 225人报名 ¥399.00 前端高手特训 从0到1带你手写一个微信小程序底层框架 高级 · 118人报名 ¥299.00 进阶必学,打造媲美ElementPlus的组件库 高级 · 396人报名 ¥399.00 程序员的 AI 启蒙课,ChatGPT 辅助开发 Vue3 项目 初级 · 784人报名 ¥199.00 C++从0实现百万并发Reactor服务器 中级 · 138人报名 ¥299.00 慕课甄选-2024年Flutter零基础极速入门到进阶实战 中级 · 489人报名 ¥399.00 NLP系统精讲与大厂案例落地实战,吃透内容理解体系 初级 · 55人报名 ¥399.00 Go从入门到进阶,大厂案例全流程实践 中级 · 133人报名 ¥299.00 全新Swift入门到进阶实战探探iOS APP 入门 · 114人报名 ¥299.00 Go微服务系统精讲 Go-Zero全流程实战即时通讯 ( IM ) 中级 · 168人报名 ¥399.00 产品经理进阶,多领域产品全流程实战训练 中级 · 38人报名 ¥199.00 小白算法集训营-大幅提升刷题量,快速逃离新手区 中级 · 110人报名 ¥199.00 AI岗位就业指南:剖析企业需求,展现个人优势 入门 · 1233人报名 免费 徐老师带你新一代分布式调度工具-DolphinScheduler 中级 · 821人报名 免费 MySQL数据库(上)- 基础入门 入门 · 3812人报名 免费 MySQL数据库(下)-数据操作 入门 · 1978人报名 免费 Express 基础入门 入门 · 1347人报名 免费 AI大模型应用开发(一)热门大模型应用使用 入门 · 661人报名 免费 鸿蒙NEXT应用开发指南 入门 · 1084人报名 免费 2小时极速入门脚手架开发 初级 · 1800人报名 免费 以近7日购买、学习相关数据为依据;每日更新 畅销榜 AI Agent智能应用从0到1定制开发 全流程解决方案实战 ¥368.00 765人在学 30天 零基础 系统化学会C++ ¥38.00 1288人在学 2024 Java 高分面试宝典 一站式搞定技术面+项目面 ¥269.00 74人在学 查看完整榜单 新课榜 高性能GO企业级APM监控系统实战 ¥269.00 难度 中级 SpringCloud+Netty集群实战千万级 IM系统 ¥299.00 难度 中级 数据分析思维实战课-人人都能用得上 ¥99.00 难度 初级 查看完整榜单 学习榜 AI Agent智能应用从0到1定制开发 全流程解决方案实战 ¥368.00 765人在学 2024版 前端框架及项目面试 聚焦Vue3/React/Webpack ¥399.00 4628人在学 30天 零基础 系统化学会C++ ¥38.00 1288人在学 查看完整榜单 推荐 人工智能 前端开发 后端开发 精品免费 SpringBoot2 仿B站高性能前端+后端项目 初级 · 225人报名 ¥399.00 基于Vue3新标准,打造后台综合解决方案 高级 · 1894人报名 ¥458.00 SpringCloudAlibaba高并发仿斗鱼直播平台实战 中级 · 356人报名 讲师宠粉福利 ¥609.00 ¥699.00 2024版,React18+ Nest.js 全栈开发仿问卷星项目 中级 · 342人报名 讲师宠粉福利 ¥869.00 ¥999.00 SpringBoot+Vue3 项目实战,打造企业级在线办公系统 中级 · 2155人报名 ¥399.00 (打造简历金牌项目)Vue+Go 开发企业级微服务网关项目 中级 · 1306人报名 ¥348.00 Python3.8系统入门+进阶 (程序员必备第二语言) 初级 · 14350人报名 ¥366.00 前端面试全家桶,从求职准备到面试演练 2024升级TS 中级 · 351人报名 讲师宠粉福利 ¥1129.00 ¥1299.00 程序员的 AI 启蒙课,ChatGPT 辅助开发 Vue3 项目 初级 · 784人报名 ¥199.00 AI大语言模型 ChatGPT从0到1打造私人智能英语学习助手 中级 · 737人报名 ¥299.00 从0到1训练私有大模型 ,企业急迫需求,抢占市场先机 中级 · 519人报名 ¥299.00 ChatGPT + Flutter快速开发多端聊天机器人App 中级 · 296人报名 讲师宠粉福利 ¥399.00 ¥448.00 AI人人必修-提示词工程+大模型多场景实战(丰富资料) 初级 · 341人报名 ¥299.00 TensorFlow+CNN实战AI图像处理,轻松入行计算机视觉 初级 · 109人报名 ¥299.00 ChatGPT+AI技术项目实战,打造多端智能虚拟数字人 初级 · 237人报名 ¥199.00 Python3入门人工智能 掌握机器学习+深度学习 初级 · 1860人报名 ¥448.00 WebGL+Three.js 入门与实战,系统学习 Web3D 技术 入门 · 1047人报名 ¥348.00 前端必学 40个精选案例实战 从零吃透HTML5+CSS3+JS 入门 · 273人报名 ¥599.00 读懂IT行业的第一课-IT技术素养提升课-快速蜕变内行人 入门 · 79人报名 ¥199.00 Webpack5 入门与实战,前端开发必备技能 入门 · 164人报名 ¥299.00 2024版,React18+ Nest.js 全栈开发仿问卷星项目 中级 · 342人报名 讲师宠粉福利 ¥869.00 ¥999.00 Vue3+NestJS 全栈开发企业级管理后台 中级 · 203人报名 ¥399.00 手写 React 高质量源码,迈向高阶开发 高级 · 206人报名 讲师宠粉福利 ¥519.00 ¥599.00 NestJS 入门到实战 前端必学服务端新趋势 中级 · 510人报名 ¥348.00 Java零基础入门与实战 入门 · 189人报名 讲师宠粉福利 ¥519.00 ¥599.00 Netty+SpringBoot 开发即时通讯系统 初级 · 465人报名 ¥448.00 30天 零基础 系统化学会C++ 入门 · 1288人报名 助学计划 ¥38.00 ¥99.00 鸿蒙系统实战短视频App 从0到1掌握HarmonyOS 入门 · 125人报名 ¥348.00 Kubernetes系统精讲 Go语言实战K8S集群可视化 中级 · 358人报名 ¥399.00 SpringCloudAlibaba高并发仿斗鱼直播平台实战 中级 · 356人报名 讲师宠粉福利 ¥609.00 ¥699.00 2024全新版 操作系统入门与实践-参透技术本质 中级 · 191人报名 讲师宠粉福利 ¥369.00 ¥399.00 技术大牛成长课,从0到1带你手写一个数据库系统 高级 · 245人报名 讲师宠粉福利 ¥629.00 ¥699.00 手把手带你前端快速入门 入门 · 4144人报名 免费 RN实现原生扫码功能 初级 · 1582人报名 免费 CSS3布局样式与案例 入门 · 3450人报名 免费 【新版】程序员2天快速入门Linux 入门 · 7633人报名 免费 2023程序员算法与数据结构面试攻略 初级 · 2875人报名 免费 HTML5基础入门与实例 初级 · 6856人报名 免费 web3.0-区块链 入门指南 入门 · 6017人报名 免费 1小时带你写出亮眼的前端简历 入门 · 10321人报名 免费 推荐 前端开发 后端开发 移动开发 全部 从Python入门/统计学基础到工业级量化交易策略实战,能力逐步提升,让你成为职业的量化交易开发工程师,进军前景可观的金融高薪领域。 4步骤 · 4门课 300收藏 K8s系统性入门到深入原理,以及生产落地实践,充分运用K8s特性进行云原生微服务领域开发,并掌握云原生底层的开发技术。 4步骤 · 4门课 94收藏 路线吃透面试学问,伴随身为Java工程师的你一路成长,高效充分准备面试拿offer。 3步骤 · 4门课 11356收藏 本路线精选程序员必修的计算机基础核心知识,有序打基础职场走更远。 5步骤 · 5门课 11391收藏 大厂校招、社招 算法数据结构类问题一网打尽。 4步骤 · 4门课 107收藏 对标大厂岗位需求,从音视频基础入门、处理核心技术到服务器设计开发\xa0,全面培养5G时代人才。 6步骤 · 6门课 1260收藏 本路线从Node.js系统入门=》积累项目经验=》深入高阶开发,层层递进,全面深入=》NestJS框架\n 4步骤 · 6门课 4478收藏 路线专为想学Vue却无从下手的人群设计,以实际项目为例,逐层深入,学透Vue。 4步骤 · 8门课 20250收藏 路线从零起步玩转React.js开发,从基础夯实到企业级项目实战,直到源码全覆盖。 4步骤 · 6门课 4836收藏 路线从零起步,系统培养爬虫工程师,步步为营打造爬虫工程师的核心竞争力。 3步骤 · 3门课 15058收藏 本路线旨在帮助想快速掌握SpringBoot应用的工程师,全方位多角度带你升级。 4步骤 · 6门课 11394收藏 一举吃透最耗时的数据库,学会数据库的基本使用、业务库的设计与架构,面试收尾升华所学。 5步骤 · 6门课 5964收藏 本路线从Flutter基础入门到混合开发,再到Flutter高级进阶,以及与热门ChatGPT技术相结合,全力打造完整的Flutter跨平台技术的学习路线。 5步骤 · 5门课 31收藏 精准对标移动端高级工程师的岗位要求,技能步步拔高,是移动端工程师进阶高工不二之选。 3步骤 · 4门课 5781收藏 路线汇集Android高级工程师面试的关键技能,还原面试官视角,助力面试顺利通关。 4步骤 · 4门课 1590收藏 \n\n 使用 Ctrl+D 可将网站添加到书签 收藏网站 官方公众号 官方微博 官方空间 企业服务 网站地图 关于我们 联系我们 讲师招募 帮助中心 意见反馈 代码托管 Copyright© 2024 imooc.com\xa0\xa0京ICP备 12003892号-11 京公网安备11010802030151号 营业执照 友情链接: 帮考网 慕课教程 育路教育 图片素材 精英考试网 求艺网 橡皮牛教育网 高顿教育 W3Cschool 会计学堂 招生信息网 慕课专题 起点课堂 在职研究生 溜溜自学网 人人都是产品经理 考研 节日作文范文 新东方前途出国 APP开发 好发表\xa0 CRMEB CG教育 大风车网 组卷网 高考志愿填报 运营营销推广 西部数码 新上好课 慕课榜单 进站必学 学习路线 意见反馈 分销返利 帮助中心 APP下载 官方微信 返回顶部 \n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n', metadata={'source': 'https://imooc.com', 'title': 'xxx', 'language': 'No language found.'})]
WebBaseLoader 加载器底层会从 HTML 网页中加载所有文本(去除 HTML 标签),并将所有文本进行合并。利用这个加载器其实就可以快速实现一个基于特定网页问答的聊天机器人。