BeautifulSoup简明教程

这篇教程介绍了BeautifulSoup库的使用,包括安装、tag对象的操作,如.name、.string和属性访问,以及通过CSS选择器和find_all方法寻找tag。强调了CSS选择器的不同用法和find_all方法对正则表达式的支持,提供了最佳实践建议。
摘要由CSDN通过智能技术生成

官方中文帮助文档

安装

conda install bs4
conda install lxml

tag对象

  • .name
  • .string
  • [‘attr’]
    • [‘class’]
    • [‘id’]

#寻找tag的方法

直接定位tag对象(这个不常用)

  • soup.head.title 用根对象层层找下去,找到第一个就返回。
  • 返回一个tag对象

CSS选择器 select/select_one

  • tag.select(‘html head title’) # 按名字找,逐层查找,有子孙关系即可返回tag列表
  • tag.select(‘html>head>title’) # 按名字找,逐层查找强调直接父子关系
  • tag.select(’#link1’) # 按id属性来找
  • tag.select(’.sister’) # 按class属性来找
  • tag.select(’.sister,.brother’) # 按class多属性来找
  • tag.select(‘a[href]’) # 按属性是否存在来找
  • tag.select(‘a[href=“xxx”]’) # 按属性的值找
  • 找到多个对象
  • 返回list
  • soup和tag都可以用

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

李大数

工作如蚂蚁,生活似蝴蝶

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值