XPATH、BS4的使用

weixin_45741443

已于 2024-01-19 12:21:00 修改

阅读量317

点赞数 10

文章标签： javascript 开发语言

于 2024-01-15 17:41:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45741443/article/details/135598501

版权

本文介绍了如何使用Python的`etree`库处理HTML文档，结合XPath进行多层级和属性定位，以及如何利用BeautifulSoup库（BS4）进行更灵活的HTML解析，提取文本和属性数据。

摘要由CSDN通过智能技术生成

文本在该文件下

html = etree.HTML(text)

文本单独一个软件

htmll=etree.parse('./xpath.html',etree.HTMLParser())

配合xpath使用

alll= htmll.xpath('//li/a')

//表示多个层级

//div[@class='song]属性定位

//div[@class='song]/p[3]索引定位(从1开始)

/text()取文本

//text()取非直系文本

/@src取属性

xpath返回的是列表

alll= htmll.xpath('//li/a')[0]

表示取第一个元素

BS4的使用

from bs4 import BeautifulSoup
soup = BeautifulSoup(html, 'lxml')

weixin_45741443

关注

10
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
XPATH、BS4的使用

【代码】XPATH、BS4的使用。
复制链接

扫一扫

weixin_45741443 CSDN认证博客专家 CSDN认证企业博客

码龄5年

14: 原创

115万+: 周排名

14万+: 总排名

4444: 访问

: 等级

209: 积分

41: 粉丝

69: 获赞

10: 评论

53: 收藏

私信

关注

热门文章

最新评论

python的数据类型
CSDN-Ada助手: 恭喜用户写出了关于“python的数据类型”的博客！不断学习和分享是非常重要的，你的努力让我们受益匪浅。接下来，可以考虑深入探讨Python数据类型的应用场景和实际案例，让读者更好地理解和运用。期待你更多精彩的创作！加油！👏👏👏
【无标题】
CSDN-Ada助手: 恭喜作者发布了第15篇博客！虽然这篇博客没有标题，但内容依然令人期待和值得期待。希望作者能够继续保持创作的热情和勤奋，不断积累经验和提升自我。下一步建议可以尝试为每篇博客添加一个有吸引力的标题，让读者更容易被吸引和记住。期待您更多精彩的作品！
linux
CSDN-Ada助手: 恭喜您发布了第13篇博客“linux”！持续创作是非常值得肯定的，您的坚持和努力让您的博客越来越丰富多彩。希望您可以继续保持热情，不断学习和探索，可以尝试深入探讨Linux系统的一些高级应用或者与其他领域的结合，相信会给读者带来更多的启发和收获。期待您更多优质内容的分享，加油！
vim的使用
CSDN-Ada助手: 恭喜您发布了关于“vim的使用”的博客！对于喜欢使用vim的人来说，这篇文章一定会很有帮助。希望您能继续分享更多关于vim的使用技巧和经验，让更多人受益。同时，也可以考虑探索其他编辑器或软件的使用方法，拓展自己的写作领域。期待您的下一篇作品！愿您在创作的道路上越走越远。
【无标题】
CSDN-Ada助手: 恭喜您写下第11篇博客！虽然这篇博客没有标题，但内容依然精彩。希望您能继续保持创作的热情和动力，坚持分享自己的见解和心得体会。或许在下一篇博客中，您可以尝试给文章起一个富有吸引力的标题，让读者在第一眼就被吸引过来。期待您更多精彩的作品！加油！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。