简单了解Beautiful Soup及运用

最新推荐文章于 2024-03-13 20:28:15 发布

平淡中的乐趣

最新推荐文章于 2024-03-13 20:28:15 发布

阅读量630

点赞数

文章标签： Beautiful Soup

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gghhm/article/details/97293481

版权

简单了解Beautiful Soup

Beautiful Soup是一个基本选择器，标准选择器，css选择器
它与xpath的用途差不多，但是
xpath:是标签选择器，所以它是检索局部的
而Beautiful Soup:是检索全局的
所以如果单单只是普通的查询的话，建议还是使用xpath，效率高，但是Beautiful Soup精度比xpath要高些

基础语法

（1）、通过标签名

html_doc.select(‘img’)

（2）、通过类名查找

html_doc.select(’.easyCon’)

（3）、通过id查找

html_doc.select(’#id’)

（4）、混合查找

html_doc.select(‘img #noLogin’)

在img标签中，找到id = noLogin的内容

如果找不到，就返回一个空列表

（5）、按照属性查找

html_doc.select(‘li[id=“noLogin”]’)

（6）、获取属性与文字部分

a_obj = html_doc.select(‘li[id=“noLogin”] a’)[]

print(a_obj)

print(‘获取属性’,a_obj.attrs[‘href’])

print(‘获取文字’,a_obj.get_text())

其实Beautiful Soup语法和xpath也差不多，毕竟所谓一样通样样通是吧

平淡中的乐趣

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。