这里写目录标题
本节课内容所需要安装的 库:
第一个:bs4 库
第二个:lxml 库
不会安装包库的请参考 《第4课:在 Pycharm 编译器里,如何安装库 模块 包》
BeautifulSoup 简介:
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.
点击进入 bs4: 官方中文文档
lxml 简介:
lxml是功能最丰富,最易于使用的库,用于以Python语言处理,解析,格式化 XML和HTML。
本教程介绍了Python的BeautifulSoup库,用于从HTML和XML文件中提取数据。讲解了BeautifulSoup与requests、lxml的关系,以及如何使用它们解析和筛选网页信息。还涉及到HTML基础、for循环和变量名的概念,提供了代码实例来演示如何抓取并打印CSDN文章标题。
订阅专栏 解锁全文
343

被折叠的 条评论
为什么被折叠?



