python中的beautifulsoup和xpath有什么异同点？

最新推荐文章于 2024-08-22 12:41:20 发布

木风QAQ

最新推荐文章于 2024-08-22 12:41:20 发布

阅读量2.5k

点赞数 4

python中的beautifulsoup和xpath有什么异同点？.note 作者：彭泉鑫

链接：https://www.zhihu.com/question/26494302/answer/78528053

来源：知乎

著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

谢邀，BeautifulSoup是一个库，而XPath是一种技术，python中最常用的XPath库是lxml，因此，这里就拿lxml来和BeautifulSoup做比较吧

1 性能 lxml >> BeautifulSoup

BeautifulSoup和lxml的原理不一样，BeautifulSoup是基于DOM的，会载入整个文档，解析整个DOM树，因此时间和内存开销都会大很多。而lxml只会局部遍历，另外lxml是用c写的，而BeautifulSoup是用python写的，因此性能方面自然会差很多。

2 易用性 BeautifulSoup >> lxml

BeautifulSoup用起来比较简单，API非常人性化，支持css选择器。lxml的XPath写起来麻烦，开发效率不如BeautifulSoup。

title = soup.select('.content div.title h3')

同样的代码用Xpath写起来会很麻烦

title = tree.xpath("//*[@class='content']/div[@class='content']/h3")

3 总结

需求比较确定，要求性能的场合用lxml，快速开发用BeautifulSoup

ps: BeautifulSoup4可以使用lxml作为parser了

右键“审查元素”，选中需要的div后再右键可以直接复制xpath的。我个人觉得xpath的易用性也强过BS

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

木风QAQ

关注关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

解析工具的使用——Beautiful Soup、XPath

dengzhh3的博客

05-13

1723

2.1 Beautiful Soup Beautiful Soup借助网页的结构和属性等特性来解析网页其在解析时实际上依赖解析器，它除了支持Python标准库中的HTML解析器外，还支持一些第三方解析器（比如lxml）——我选择使用lxml ...

python中beautifulsoup的作用_Python3中BeautifulSoup的使用方法

weixin_30641041的博客