爬虫之select

最新推荐文章于 2021-09-02 22:49:37 发布

默木

最新推荐文章于 2021-09-02 22:49:37 发布

阅读量550

点赞数 3

文章标签： html css

本文链接：https://blog.csdn.net/yanfumin/article/details/107216184

版权

通过 CSS 也是可以定位元素
的位置。在写 CSS 时，标签名不加任何修饰，类名前加点 . ，id 名前加 #，在这里我们也可以利用类似的方法来筛选元素，用到的方法是 soup.select()，返回类型是 list。

select的语法
"."表示class属性
“#”表示id属性

通过css的class类查找
print soup.select(".sister")
print soup.select("[class~=sister]")
通过tag的id属性查找
print soup.select("#link1")
print soup.select(“a#link2”)
通过属性值来查找
print soup.select(‘a[href=“http://example.com/elsie”]’)
print soup.select(‘a[href^=“http://example.com/”]’)
print soup.select(‘a[href$=“tillie”]’)
print soup.select(‘a[href*=".com/el"]’)
查找p节点下下ID属性的标签
print soup.select(“p > #link1”)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注