selenium 基于模拟浏览器的方式 基本任何网页都可以抓取
selenium一般有八种定位方法
- By.id() 通过id定位
- By.name() 通过name 定位
- By.xpath() 通过xpath定位
- By.className() 通过className定位
- By.cssSelector() 通过CSS 定位
- By.linkText() 通过linkText
- By.tagName() 通过tagName
- By.partialLinkText() 通过匹到的部分linkText
这里面cssSelector() 没怎么接触过,其余基本都见过,后续逐渐学习 投入实际应用,CSS(即层叠样式表Cascading Stylesheet) Selector来定位(locate)页面上的元素(Elements),顺便查了点css 相关的资料
CSS的语法:
CSS的定义是由三个部分构成:
选择符(selector),属性(properties)和属性的取值(value)。
语法: selector {property: value} (选择符 {属性:值})
说明:
·选择符是可以是多种形式,一般是你要定义样式的HTML标记,例如BODY、P、TABLE……,你可以通过此方法定义它的属性和值,属性和值要用冒号隔开:
例子:body {color: black},此例的效果是使页面中的文字为黑色。
·如果属性的值是多个单词组成,必须在值上加引号,比如字体的名称经常是几个单词的组合:
例子:p {font-family: "sans serif"} (定义段落字体为sans serif)
· 如果需要对一个选择符指定多个属性时,我们使用分号将所有的属性和值分开:
例子:p {text-align: center; color: red} (段落居中排列;并且段落中的文字为红色)