一、搭建环境
1、安装Slenium
pip install selenium
2、安装浏览器驱动-》查询浏览器版本-》下载对应版本驱动-》在path路径中配置(浏览器更新需要重新下载)
pip install webdriver -helper(自动化)python3.9以上
pip install 安装包的绝对路径
二、元素定位
概念:对浏览器控制,同通过webdriver对象对网页内容(元素)的控制,通过webElement对象,元素定位,实际就是通过webdriver获得webElement过程,Selenium提供了8个定位策略
1、基于属性的定位:
<input >
2、基于文本的定位
<a >新闻 </ a >
<a 这里是属性>新闻 这里是文本</ a>
局限性,只能定位连接
3、基于表达式的定位
css
xpath
*为什么选择xpath?
xpath是文档查询语言,天生兼容HTML,xpath能很好根据文档层次定位
三、Xpath语言
1、看懂符号
//[@id=“su”]
2、用对函数
text 获取元素内的文本 //a[text()=“新闻”]
Contains 任意位置包含
Start-with
last()