Python爬虫遇到HTML标签属性带有 ‘-’ 符号时怎么处理

最新推荐文章于 2023-09-19 23:45:19 发布

重生之我是蔡经理

最新推荐文章于 2023-09-19 23:45:19 发布

阅读量1.8k

点赞数

分类专栏： Python爬虫文章标签： python 爬虫 css html

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/miyagiSimple/article/details/118933544

版权

Python爬虫专栏收录该内容

1 篇文章 0 订阅

订阅专栏

题主在写一些爬虫代码的时候，偶尔会遇到一些标签中带有‘-’的属性名称。
例如：

<p css-style="a style">.....</p>

之前看有的写法就是先利用BeautifulSoup的find_all函数找到所有p标签，再遍历询问 if p[‘css-style’] == ‘a style’。
因为 find_all(‘p’, css-style=‘a style’) 是不合规的.

这里完全可以使用BeautifulSoup的select()函数，利用类似CSS选择器的方法来筛选元素。它返回的类型是一个list

p_list = bs.select("p[cms-style='a style']")

无论是查找id还是class，select()函数的查找方式都和CSS类似

soup.select('.a_class') #查找class="a_class"
soup.select('#a_id')	#查找id="a_id"

重生之我是蔡经理

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫遇到HTML标签属性带有 ‘-’ 符号时怎么处理

题主在写一些爬虫代码的时候，偶尔会遇到一些标签中带有‘-’的属性名称。例如：<p css-style="a style">.....</p>之前看有的写法就是先利用BeautifulSoup的find_all函数找到所有p标签，再遍历询问 if p[‘css-style’] == ‘a style’。因为 find_all(‘p’, css-style=‘a style’) 是不合规的.这里完全可以使用BeautifulSoup的select()函数，利用类似CSS选择器
复制链接

扫一扫

专栏目录

重生之我是蔡经理 CSDN认证博客专家 CSDN认证企业博客

码龄4年

12: 原创

60万+: 周排名

8万+: 总排名

1万+: 访问

: 等级

182: 积分

20: 粉丝

52: 获赞

10: 评论

31: 收藏

私信

关注

热门文章

分类专栏

最新评论

VUEX 3.x源码分析——1. 理解state
CSDN-Ada助手: 恭喜你发布了第12篇博客《VUEX 3.x源码分析——1. 理解state》，内容深度剖析了VUEX 3.x中state的重要性，让读者受益匪浅。希望你能继续坚持创作，为大家带来更多深入浅出的技术分享。下一步可以考虑结合实际案例，展示state在实际项目中的应用，这样读者更容易理解和实践。期待你的更多精彩文章，加油！
vue页面多个数量不定的table如何增加拖动功能
php9527: 不生效
vue页面多个数量不定的table如何增加拖动功能
重生之我是蔡经理: 我这个场景不适合，用户在页面点击完新增table按钮后，还会点击“在当前table新增一条”的按钮执行另一异步操作。nexttick在这些操作之前被调用了，导致拖动绑定不到新的dom中，无法操作拖动。所以简单地做了一个延迟。
Element UI 如何改变select选择框自身的字体颜色
时雨乍停: 在<style scoped>里按照楼主的写法加上/deep/生效了
vue页面多个数量不定的table如何增加拖动功能
niaogehuifei: this.$nextTick(() => { this.dargRow(); })用这个替换延时会不会更合适一些

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。