1.操作浏览器的基本方法
selenium 的一切操作都是模拟人工(不完全等于人工操作)。
#coding=utf-8
#导入webdriver模块
from selenium import webdriver
#导入time模块
import time
#打开火狐浏览器
driver=webdriver.Firefox()
#打开百度
driver.get("https://www.baidu.com")
#休眠3秒
time.sleep(3)
#刷新页面
driver.refresh()
#打开csdn博客
driver.get("https://my.csdn.net/")
#返回上一页面
driver.back()
#切换到下一页
driver.forward()
#设置窗口大小为540*960
driver.set_window_size(540,960)
#休眠2秒
time.sleep(2)
#将浏览器窗口最大化
driver.maximize_window()
#截图并保存(截屏后设置制定的保存路径+文件名称+后缀)
driver.get_screenshot_as_file("E://test.jpg")
#关闭当前窗口
driver.close()
#关闭浏览器
driver.quit()
2.元素定位浏览器
selenium的webdriver提供了18种(注意是18种,不是8种)
的元素定位方法
1.环境准备
(火狐浏览器47版一下,安装插件:Firebug和FirePath)
安装完成后,页面右上角有个小爬虫图标
2.查看页面元素
3.通过属性定位元素
- id定位 :find_element_by_id()
#coding=utf-8
from selenium import webdriver
driver=webdriver.Firefox()
driver.get("https://www.baidu.com")
#通过id定位百度搜索框,输入python
driver.find_element_by_id("kw").send_keys("python")
- name定位:find_element_by_name()
#coding=utf-8
from selenium import webdriver
driver=webdriver.Firefox()
driver.get("https://www.baidu.com")
#通过name定位百度搜索框,并输入python
driver.find_element_by_name("wd").send_keys("python")
- class定位:find_element_by_class_name()
#coding=utf-8
from selenium import webdriver
driver=webdriver.Firefox()
driver.get("https://www.baidu.com")
#通过class定位百度搜索(class属性有空格,取其一就行)
driver.find_element_by_class_name("s_ipt").send_keys("python")
- tag定位: find_element_by_tag_name()
#coding=utf-8
from selenium import webdriver
driver=webdriver.Firefox()
driver.get("https://www.baidu.com")
#通过tag(标签)定位百度搜索框,并输入python,
# 运行会报错,因为一个页面有多个相同的标签
driver.find_element_by_tag_name("input").send_keys("python")
- link定位:find_element_by_link_text()
#coding=utf-8
from selenium import webdriver
driver=webdriver.Firefox()
driver.get("https://www.baidu.com")
#通过link(超链接)属性定位到新闻按钮,并点击
driver.find_element_by_link_text("新闻").click()
- partial_link定位: find_element_by_partial_link_text()
#coding=utf-8
from selenium import webdriver
driver=webdriver.Firefox()
driver.get("https://www.baidu.com")
#模糊查询定位hao123
driver.find_element_by_partial_link_text("hao").click()
- xpath定位 : find_element_by_xpath()
#coding=utf-8
from selenium import webdriver
driver=webdriver.Firefox()
driver.get("https://www.baidu.com")
#在FirePath里copy出xpath地址
driver.find_element_by_xpath(".//*[@id='kw']").send_keys("python")
- css定位: find_element_by_css_selector()
#coding=utf-8
from selenium import webdriver
driver=webdriver.Firefox()
driver.get("https://www.baidu.com")
#在FirePath里选择css插件定位,在输入框输入python
driver.find_element_by_css_selector("#kw").send_keys("python")
- xpath属性定位
#coding=utf-8
from selenium import webdriver
driver=webdriver.Firefox()
driver.get("https://www.baidu.com")
#xpath属性定位
driver.find_element_by_xpath(".//*[@id='kw']").send_keys("python3")
driver.find_element_by_xpath(".//*[@name='wd']").send_keys("python3")
driver.find_element_by_xpath(".//*[@class='s_ipt']").send_keys("python3")
driver.find_element_by_xpath(".//*[@autocomplete='off']").send_keys("python3")
- By:定位find_element()(定位方法参数化)
#coding=utf-8
from selenium import webdriver
from selenium.webdriver.common.by import By#By定位法,整合其他定位方法
#打开火狐
driver=webdriver.Firefox()
#打开百度网页
driver.get("https://www.baidu.com")
#调用id定位百度输入框
driver.find_element(By.ID,"kw").send_keys(123)