元素操作
- 点击元素 :element.click()
- 输入文本:element.send_keys(“文本”)
- 清除文本框内容:element.clear()
浏览器界面操作
- 打开浏览器:webdriver.get(url)
- 获取浏览器标题:webdriver.title
- 获取当前页面的链接:webdriver.current_url
- 获取页面的element:webdriver.page_source
- 关闭窗口:webdriver.close()
- 刷新窗口:webdriver.refresh()
- 后退:webdriver.back()
- 前进:webdriver.forward()
- 窗口最大化:webdriver.maximize_window()
- 浏览器指定大小:webdriver.set_window_size(weight,height)
- 将窗口放在指定位置:webdriver.set_window_position(500,0)
- 获取cookies:webdriver.get_cookies()
- 获取当前窗口的size(返回字典型):webdriver.get_window_size()
定位操作
- id定位:find_element_by_id(id_=‘colorbox’)
- xpath定位: find_element_by_xpath(self, xpath)
- 超链接定位:find_element_by_link_text(self, link_text)
- name定位:find_element_by_name(self, name)
- tag定位:find_element_by_tag_name(self, name)
- class定位:find_element_by_class_name(self, name)
- css定位:find_element_by_css_selector(self, css_selector)
注意:
以上定位,返回的都是一个,而且是第一个,将element改为elements返回的是多个或者一个
案例
from selenium.webdriver import Chrome
#输入一个指令,键盘上的按钮,需要导入包:
from selenium.webdriver.common.keys import Keys
# import time
web = Chrome()
web.get("http://lagou.com")
# 找到某个元素,点击它
el = web.find_element_by_xpath('//*[@id="changeCityBox"]/p[1]/a')
el.click() #点击事件
# # 注意
# el = web.find_element_by_name("???")#找到的是第一个
# el = web.find_elements_by_name("???")#找到的是全部
# #注意:在进行操作时,有可能会加载到一个新的页面,有时他的加载速度会比我们的执行速度慢,这就会导制程序报错
# #解决方法:导入time包,让浏览器缓一会
# time.sleep(1) # 让浏览器缓一缓
# 找到输入框,输入python =>输入回车/点击搜索按钮
web.find_element_by_xpath('//*[@id="search_input"]').send_keys("python",Keys.ENTER)
#查找存放数据的位置,进行数据提取
#找到页面中存放数据的所有的item
item_list = web.find_elements_by_xpath('//*[@id="jobList"]/div[1]/div')
for item in item_list:
job_name = item.find_element_by_xpath('./div[1]/div[1]/div[1]/a').text
print("工作:",job_name)
job_company = item.find_element_by_xpath('./div[1]/div[2]/div[1]/a').text
print('公司:',job_company)
job_salary = item.find_element_by_xpath('./div[1]/div[1]/div[2]/span').text
print("工资:",job_salary)
job_request = item.find_element_by_xpath('//*[@id="jobList"]/div[1]/div[6]/div[1]/div[1]/div[2]').text
print('要求:',job_request)