Python爬虫库BeautifulSoup获取对象名,属性,内容,注释

最新推荐文章于 2024-06-17 06:32:02 发布

xiaoyaGrace

最新推荐文章于 2024-06-17 06:32:02 发布

阅读量735

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaoyaGrace/article/details/106275005

版权

本文详细介绍了如何利用Python的BeautifulSoup库来获取HTML对象的名称、属性、内容和注释，对于进行网页抓取和数据提取的初学者极具指导价值。

摘要由CSDN通过智能技术生成

如何利用Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释等操作下面就为大家介绍一下
一、Tag(标签)对象

1.Tag对象与XML或HTML原生文档中的tag相同。

from bs4 import BeautifulSoup
soup = BeautifulSoup('<b class="boldest">Extremely bold</b>','lxml')
tag = soup.b
type(tag)
bs4.element.Tag
2.Tag的Name属性

每个tag都有自己的名字智汇返佣http://www.kaifx.cn/broker/thinkmarkets.html
，通过.name来获取

tag.name
'b'
tag.name = "blockquote" # 对原始文档进行修改
tag
<blockquote class="boldest">Extremely bold</blockquote>
3.Tag的Attributes属性

获取单个属性

tag['class']
['boldest']
按字典的方式获取全部属性

tag.attrs
{'class': ['boldest']}
添加属性<

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

xiaoyaGrace CSDN认证博客专家 CSDN认证企业博客

码龄5年

1265: 原创

13万+: 周排名

202万+: 总排名

56万+: 访问

: 等级

1万+: 积分

62: 粉丝

110: 获赞

42: 评论

686: 收藏

私信

关注

热门文章

分类专栏

最新评论

华为OD两轮技术面试
梦想橡皮擦: 华为OD机试题 Python，java，C++，js 代码分享，帮助600+人高分通过机试了 https://blog.csdn.net/hihell/category_12199275.html
用python算卦——银钱演算法
muenfox: 感谢分享，学习了
HBase 中加盐（Salting）之后的表如何读取：协...
qq_36469875: 話説你們實現過嗎? proto 生成的java類，裏面有很多語法錯誤，以及包找不到
标准正交表与混合正交表的使用
搞测试的: 在哪下载呢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。