beautifulsoup,一些语法。

**

beautifulsoup,一些语法。

**

从网页获取HTML数据后,获取对应标签、属性的值

取值方法主要有以下几种:

1.通过标签名(tag)获取: tag.name
tag对应的type是<class ‘bs4.element.Tag’>

2.通过属性(attrs)获取:tag.attrs

通过标签属性获取: tag[“class”] 或 tag.get(“class”)

获取对应的内容

  1. tag.string 获取当前标签的内容

  2. tag.get_text() 获取标签内所有的字符串

查找相应的内容

1.find_all(class_=“class”) 返回的是多个标签,格式为<class ‘bs4.element.ResultSet’>

2.find(class_=“class”) 返回一个标签,格式是<class ‘bs4.element.Tag’>

3.select_one() 返回一个标签,格式是<class ‘bs4.element.Tag’>

4.select() 返回的是多个标签,格式为<class ‘bs4.element.ResultSet’>

1和4是返回组标签(就算只有一个标签也是一组)

取值时需要先定位,定位是list(ResultSet)中的那个标签在取值

tag[0].string

使用 find_all() 不带条件查找,tag[0][“class”].string

因为class是python的关键字,所以在写过滤的时候,应该是这样写:

soup.find_all(‘a’,class_=‘xxx’)
soup.select(a[class=‘xxx’])

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值