LangChain 非常强大的一点就是封装了非常多强大的工具可以直接使用。降低了使用者的学习成本。比如数据网页爬取。
在其官方文档-网页爬取中,也有非常好的示例。
应用场景
- 信息爬取。
- RAG 信息检索。
实践应用
需求说明
- 从 ceshiren 网站中获取每个帖子的名称以及其对应的url信息。
实现思路
对应源码
总结
- 了解网页爬取的实现思路以及相关技术。
- 通过LangChain实现爬取测试人网页的标题和url。
LangChain 非常强大的一点就是封装了非常多强大的工具可以直接使用。降低了使用者的学习成本。比如数据网页爬取。
在其官方文档-网页爬取中,也有非常好的示例。