Selenium、xpath、div在爬虫中的相互关系及用法

最新推荐文章于 2024-04-20 20:58:15 发布

PerpetualLearner

最新推荐文章于 2024-04-20 20:58:15 发布

阅读量1.1k

点赞数 1

分类专栏： # 小白学Python 文章标签： selenium xpath div

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/The_Time_Runner/article/details/92417010

版权

小白学Python 专栏收录该内容

488 篇文章 77 订阅

订阅专栏

学习爬虫，用到上述三个概念，完全没接触过，研究如下：

Selenium¹

web自动化测试工具集。

WebDriver就是一层基础的协议规范。

selenium通过xpath的定位，就想我们采用鼠标定位一样对页面做操作。
```
from  selenium import webdriver    #导入python版的selenium(webdriver)find_element_by_id("xx")   #id定位方法
```

xpath²

XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。

常用的路径表达式：

表达式	描述
nodename	选取此节点的所有子节点。
/	从根节点选取。
//	从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置。
.	选取当前节点。
…	选取当前节点的父节点。
@	选取属性。

关于xpath的定位，参见《Chrome、Firefox定位xpath方法2019年》《python selenium xpath定位方式》

div³

DIV元素是用来为HTML（标准通用标记语言下的一个应用）文档内大块（block-level）的内容提供结构和背景的元素。

可定义文档中的分区或节（division/section）。
标签可以把文档分割为独立的、不同的部分。它可以用作严格的组织工具，并且不使用任何格式与其关联。
如果用 id 或 class 来标记

，那么该标签的作用会变得更加有效。

是一个块级元素。这意味着它的内容自动地开始一个新行。实际上，换行是
固有的唯一格式表现。可以通过
的 class 或 id 应用额外的样式。
不必为每一个

都加上类或 id，虽然这样做也有一定的好处。

Reference

selenium，自动化基础普及之selenium是啥？， selenium， 2017.02 ↩︎
W3school，xpath语法 ↩︎
W3school, HTML

标签 ↩︎

PerpetualLearner

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Selenium、xpath、div在爬虫中的相互关系及用法

学习爬虫，用到上述三个概念，完全没接触过，研究如下：Selenium1web自动化测试工具集。WebDriver就是一层基础的协议规范。selenium通过xpath的定位，就想我们采用鼠标定位一样对页面做操作。from selenium import webdriver #导入python版的selenium(webdriver)find_element_by_id("xx...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。