HTML标签
- 组成部分分为三个:标签名称(TagName)、属性(Attribute)、文本(Text)
- 常见标签名称:a/div/span/i/tr/td/input/p/form/…
- 元素的形态不要相信肉眼所见,要基于元素的属性来决定。
- 文本并不是每一个标签都具有的东西
八种元素定位法则
- 任何定位方法,都是为了准确定位到指定的元素,所以在选择定位方法的时候,必须要去校验你的定位方法是否正确及准确。
id | ID就相当于身份证号码。一般而言是不会重复的 |
---|---|
name | 基于Name属性去定位 |
class | 基于元素的class属性去进行定位 |
tag name | 基于标签名称来进行元素定位,不推荐,重复率高 |
link text | 基于a标签的text内容 |
partial link text | 基于a标签的text内容进行模糊查找 |
xpath | 基于html结构来对元素进行定位 |
css selector | 基于css样式来对元素进行定位,速度快 |
定义浏览器
from selenium import webdriver
driver = webdriver.Chrome()
driver.get('http://www.baidu.com')
- 通过id或name属性定位,