爬虫基础知识

夏夜迷

已于 2023-07-08 19:39:22 修改

阅读量927

点赞数

分类专栏：软件测试文章标签：集成测试单元测试功能测试

于 2023-07-02 17:21:05 首次发布

本文链接：https://blog.csdn.net/weixin_49415186/article/details/131502979

版权

4 篇文章 0 订阅

订阅专栏

一、xpath 语法

使用// 获取整个页面当中的元素，然后谢标签名，然后再写谓词进行提取，比如：

//title[@lang='en']

1、/和//的区别：/代表只获取子节点，//获取子孙节点；
2、container:有时候某个属性中包含了多个值，那么可以使用container函数，示例如下：

//title[contains(@lang.'en')]

3、谓词中下标是从1开始的，不是从0开始的

表达式	描述	实例	结果
nodename	选取此节点的所有字节点	bookstore	选取bookstore 下的所有子节点
/	如果在最前面，代表从跟节点选取，否则选择某节点下的某个节点	/bookstore	选根元素下所有的/bookstore节点
//	从全局节点中选择节点，随便在哪个位置	//book	从全局节点中找到所有的book节点
@	选取某个节点的属性	//book[@price]	选取所有拥有price属性的book节点
@*	匹配任意节点中的属性	//book[@*]	选取所有带有属性的book元素
*	匹配任意节点	/bookstore/*	选取bookstore下的所有子元素
/bookstore/book[1]	选取属于bookstore子元素的第一个book元素
/bookstore/book[last()]	选取属于bookstore子元素的最后一个book元素
/title[@lang]	选取所有拥有名为lang的属性的title元素
/title[@lang=‘eng’]	选取所有title元素，且这些元素拥有值为eng的lang属性