python通过selenium实现浏览器自动化操作,以及dom元素获取问题总结
from selenium import webdriver #引入selenium,没有selenium的话,执行pip install selenium进行安装
import time
option = webdriver.ChromeOptions()
browser = webdriver.Chrome(chrome_options=option)
urlinfo="此处是访问链接"
browser.get(urlinfo)
time.sleep(3)
#获取dom节点为id='test'元素
tests=browser.find_element_by_id("test") #不用'#',获取单个元素
#获取dom元素标签的元素,如a标签
test2=browser.find_element_by_tag_name("a") 为单个元素
test3=browser.find_elements_by_tag_name("a") 获取所有a标签元素
#获取dom元素指定class属性的值,这里使用的是css_selector方法,class名前需要加点
test4=browser.find_element_by_css_selector(".item") #获取单个元素
test5=browser.find_elements_by_css_selector(".item") #获取多个元素
通过class_name获取dom元素
test5-1=browser.find_element_by_class_name("ib-it-text") #获取单个元素
test5-2=browser.find_elements_by_class_name("ib-it-text") #获取多个元素
获取某个a标签的href值方法为:
test5=browser.find_element_by_tag_name("a").get_attribute('href') #只有单一元素才可以使用get_attribute方法
#获取a标签里面值的方法
test6=browser.find_element_by_tag_name("a").text
#获取img标签图片路径src的值
test7=browser.find_element_by_tag_name("img").get_attribute('src')