- Xpath语法:
获取相关标签 | Html.xpath(‘//li’)获取所有的li标签 |
获取相关的标签属性 | Html.xpath(‘//li@class’)获取li的class属性 Html.xpath(‘//li[@class=”item”]’)获取class等于item的标签 |
获取文本 | Text() |
2.BS4语法:
属性定位 | Soup.find(‘tagName’)返回符合要求的标签列表 Soup.select(‘.tang>ui>li’)class用. id用# Soup.select(‘.tang>ul a’)空格表示多个层级 |
获取标签之间的文本 | Soup.a.text/string/get_text() Text/get_text()可以获取某一个标签的所有文本内容 string只可以获取该标签下面的直系文本 |
获取标签中的属性值 | Soup.a[‘href’] |
3.selenium:
find_element_by_id() | 通过属性id进行定位 |
find_element_by_name() | 通过属性name进行定位 |
find_element_by_class_name() | 通过class名进行定位 |
find_element_by_link_text() | 通过完整的超链接对应文本进行定位 |
find_element_by_partial_link_text() | 通过部分超链接对应文本进行定位 |
find_element_by_tag_name() | 通过标签进行定位 |
find_element_by_xpath() | 通过xpath进行定位 |
find_element_by_css_selector() | 通过css选择器进行定位 |