xpath 统计有几个img标签_爬虫天天见|xpath和Lxml库的简单了解和基本用法

最新推荐文章于 2021-06-23 11:50:26 发布

weixin_39548968

最新推荐文章于 2021-06-23 11:50:26 发布

阅读量686

点赞数 1

文章标签： xpath 统计有几个img标签 xpath安装

点击上方蓝字关注我们

lxm是一个网页解析库。 Xpath是一门在xml/html中查找信息的语言，Xpath可用来在xml/html文档中对元素和属性进行遍历(寻找标签)。 lxml的安装: 方法1：

pip install lxml

方法2：

https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud

找适合自己开发版本的lxml库，下载完成之后然后进入到下载目录找到刚才下载的whl文件。然后输入以下命令。

pip install whl 文件名

例如我下载的文件在D盘根目录，所以安装的命令就是：

这样就可以成功安装lxml了。我们先来了解一下xpath的最常用的路径表达式

接下来我们看个小例子，第一部我们来获取所有的li元素。

first item second item third item fouth item fifth itemanother item

可以看到我们总共获取到了6个li元素。

2.如果我们只想要获取第一个li元素呢？很简单类似于切片的操作，但要注意这里的下标是从1开始的。现在我们来获取第一个li元素的name。参考上图我们需要用的是text()方法。

3.如果我们想要获取第三个元素的a标签的属性呢？这时就要用到我们使用上面提到的@来获取。

4.现在又有一个新的需求要获取第四个元素的href的属性要怎么做呢？

通过这几个简单小例子我们已经对xpath有了有个简单的了解。就像剥洋葱一样一层一层递进。下一节我们通过一个实例来演示一下我们今天所学的这些操作！

点个在看你最好看

关注