python基础爬虫——BeautifulSoup使用css语法查找元素

本文介绍了如何在Python中利用BeautifulSoup库结合CSS语法进行网页元素的查找。通过`tag.select(css)`方法,可以选取不同条件的HTML元素,如所有`a`标签,特定class属性的子元素等。同时,文章提到了CSS选择器的一些特殊规则,如以特定字符串开头、结尾或包含的属性匹配。
摘要由CSDN通过智能技术生成

人生不能放弃,就算是停电
很不幸,公司停电,刚刚打的代码全没有了
但还是要面对现实
加油!!!,不以物喜不以己悲

今天的学习目标是:beautifulsoup中使用css语法元素

使用css语法查找元素,需要使用css语法规则
使用方法
tag.select(css)
其返回值为一个列表,即使只有一个值
tag是一个bs4.element.Tag对象,即HTML中的一个element节点元素,select是查找方法
css是类似于css语法的一个字符串

soup.select(‘a’)查找文档中所有的元素节点
soup.select(‘p[class=‘story’] a’)查找文档中所有属性有class为story的

节点下面的所有元素的节点
soup.select(‘p[class] a’)查找文档中所有具有class属性的

节点下的所有元素节点
soup.select(‘a[id=‘link1’]’)查找文档中属性id为link1的节点
soup.select(‘body head title’)查找文档中body下面的head下面的title节点
soup.select(‘body[class]’)查找文档中body下面所有具有class属性的节点
soup.select(‘body[class] a’)查找文档中body下面所有具有class属性的节点下面的节点
需要注意的是其中的语法规则:
元素后面的[]为紧挨着元素属性,但是下一级的属性就需要空格间隔,不然调试的时候会经常出错

from bs4 import BeautifulSoup

# find_all or find
doc = '''
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>The Dormouse's story</title>
</head>
<body>
<p class="title"><b>The Dormouse's story<i>the</i></b></p>
<p class="story">
    Once upon a time there were three little sister;and their names were
    <a href="http://example.com/else" class="sister" id="link1">Elsie</a>
    <a href="http://example.com/
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值