python3个人爬虫之:BeautifulSoup学习心得

本文介绍了Python库BeautifulSoup的基本概念、安装方法、解析器选择、使用技巧,包括标签选择器、CSS选择器、获取属性和文本等操作。重点讲述了find_all()、find()和select()等查询方法,强调了其在网页数据提取中的高效性。
摘要由CSDN通过智能技术生成

一 Beautiful Soup的介绍

    官网介绍:Beautiful Soup是一个可以从HTML或者XML文件中提取数据的Python库,能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式,Beautiful Soup 会帮你节省数小时甚至数天的工作时间。

    简而言之:就是一种强大的解析工具,帮助我们从网页中提取数据时提高效率。

  【tips】: BeautifulSoup自动将输入文档转换为Unicode编码, 输出文档转换为utf-8编码。

二 安装

    推荐使用pip来安装:

    pip install beautifulsoup4

    验证是否安装成功(在解释器导入模块不报错即安装成功):

  【tips】: 这里虽然安装的是beautifulsoup4这个包,但是在引用的时候是引入bs4,因为这个包源代码本身的库文件夹名称就是  bs4 。

    

三 Beautiful Soup 的解析器比较

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值