python BeautifulSoup模块的简要介绍

 

常用介绍:

pip install beautifulsoup4  # 安装模块

from bs4 import BeautifulSoup  # 导入模块

soup = BeautifulSoup(html, 'html.parser')  # 解析网页,得到soup对象
soup.find(tag)  # 查找标签,并返回找到的第一个标签
soup.find_all(tag)  # 查找所有标签,并返回所有标签的列表
soup.get_text(tag)  # 获得标签中的文本内容
soup.get(tag)  # 获得标签的属性内容

 

CSS选择器:

from bs4 import BeautifulSoup

soup.select("title")  # 选择为“title”的标签
soup.select("body a")  # 通过标签逐层查找
soup.select("head > title")  # 找到某个标签下的直接子标签
soup.select(".sister")  # 通过CSS的类名查找
soup.select("#link1")  # 通过标签的id查找
soup.select("a[href]")  # 通过是否存在某个属性来查找

 soup.select("p a[class]"), soup.select("p a[href]"), soup.select("p a[id]"), soup.select("p a[class=sister]")  # 引号内部不需要再加引号了

 CSS选择器

参考:

BeautifulSoup文档

转载于:https://www.cnblogs.com/sxhui/p/6127723.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值