如何使用bs4爬虫解析html

  • Beautiful Soup简介
  • Beautiful Soup安装
  • Beautiful Soup用法

Beautiful Soup简介

  • 官方网址:https://beautifulsoup.readthedocs.io/zh_CN/latest/
  • Beautiful Soup是一个可以从HTML文件中提取数据的Python库,它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式
  • 在接口测试中用于验证页面内容的正确性

Beautiful Soup安装

  • Windows 下命令行输入:pip install beautifulsoup4 即可。

Beautiful Soup用法

from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc,"html.parser")
print soup
print type(soup)
print soup.prettify()# 按照标准的缩进格式的结构输出
# 通过标签名称来获取Tag对象,如果有多个相同的标签名称,返回第一个
print soup.html
print soup.body
print soup.title
print type(soup.title)# class类,tag标签
print soup.find_all('a')# 查找所有a标签
print soup.find_all('a')[2]# 查找第二个a标签
print soup.title.string# 输出字符串格式String
print soup.b.string # 输出注释

#find只返回第一个
print soup.find("id='''")

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值