在路上

独学而无友 则孤陋而寡闻

Python Xpath与Regex的区别

在进行网页信息抓取的时候,我们往往需要用到Regex或者Xpath。

二者的区别:

Regex本身是一种文本匹配的工具,由于需要多次尝试性地进行匹配,所以他适用于短小而又信息集中的文本。可以进行精确地匹配和攫取。但面对大容量的内容分散的HTML等文本,他的效率就会变得非常低。

Xpath与Regex不同,它本身是处理XML的工具,由于HTML是XML的一个真子集,所以他也适用于HTML。由此我们就可以看出来Xpath的适用范围比Regex要低很多。但适用范围小往往就更有针对性,Xpath通过树形的结构对XML进行遍历,对网页信息的抓取效率会高很多。

阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u012956540/article/details/46826835
文章标签: python regex xpath
个人分类: python
想对作者说点什么? 我来说一句

Jsoup xpath的使用

jsoup选择器

csdncjh csdncjh

2016-04-02 16:40:21

阅读数:2795

没有更多推荐了,返回首页

不良信息举报

Python Xpath与Regex的区别

最多只允许输入30个字

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭