第三章：数据解析-CSS选择器

最新推荐文章于 2022-08-18 18:32:52 发布

浊酒南街

最新推荐文章于 2022-08-18 18:32:52 发布

阅读量175

点赞数

分类专栏： # 150讲轻松搞定Python网络爬虫

本文链接：https://blog.csdn.net/weixin_43597208/article/details/105251745

版权

150讲轻松搞定Python网络爬虫专栏收录该内容

63 篇文章 1 订阅

订阅专栏

直接学习：https://edu.csdn.net/course/play/24756/280701
CSS选择器
select方法：
使用以上方法可以方便的找出元素，但有时候使用css选择器的方法可以更加的方便，使用css选择器的语法，应该使用select方法。以下列出几种常用的css选择器方法。
1、通过标签名查找

print(soup.select('a'))

2、通过类名查找
通过类名，则应该在前面加一个.。比如要查找class= sister的标签，示例代码如下：

print(soup.select('.sister'))

3、通过id查找
通过id查找，应该在id的名字前面加一个#号。示例代码如下：

print(soup.select('#link1'))

4、组合查找
组合查找即和写class 文件时，标签名与类名，id名进行的组合原理是一样的，例如查找p标签中，id等于link1的内容，二者需要用空格分开。

print(soup.select('p #link1'))

直接子标签查找，则使用>分隔：

print(soup.select('head >title'))

5、通过属性查找
查找时还可以加入属性元素，属性需要用中括号括起来，注意属性和标签属于同一节点，所以中间不能加空格，否则会无法匹配到。
示例代码如下：

print(soup.select('a[href ="http://example.com/elsie"]'))

6、获取内容
以上的select方法返回的结果都是列表形式，可以遍历形式输出，然后用get_text()方法来获取它的内容。

soup = BeautifulSoup(html,'lxml')
print(type(soup.select('title')))
print(soup.select('title')[0].get_text())

for title in soup.select('title'):
	print(title.get_text())

浊酒南街

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
第三章：数据解析-CSS选择器

直接学习：https://edu.csdn.net/course/play/24756/280701CSS选择器select方法：使用以上方法可以方便的找出元素，但有时候使用css选择器的方法可以更加的方便，使用css选择器的语法，应该使用select方法。以下列出几种常用的css选择器方法。1、通过标签名查找print(soup.select('a'))2、通过类名查找通过类名，...
复制链接

扫一扫