selenium的各种操作

最新推荐文章于 2024-10-05 22:05:13 发布

芒着可爱

最新推荐文章于 2024-10-05 22:05:13 发布

阅读量324

点赞数

分类专栏：爬虫文章标签： selenium chrome python

本文链接：https://blog.csdn.net/m0_56600567/article/details/125628404

版权

爬虫专栏收录该内容

5 篇文章 0 订阅

订阅专栏

文章目录

元素操作

点击元素：element.click()
输入文本：element.send_keys(“文本”)
清除文本框内容：element.clear()

浏览器界面操作

打开浏览器：webdriver.get(url)
获取浏览器标题：webdriver.title
获取当前页面的链接：webdriver.current_url
获取页面的element:webdriver.page_source
关闭窗口:webdriver.close()
刷新窗口:webdriver.refresh()
后退：webdriver.back()
前进：webdriver.forward()
窗口最大化：webdriver.maximize_window()
浏览器指定大小：webdriver.set_window_size(weight,height)
将窗口放在指定位置：webdriver.set_window_position(500,0)
获取cookies:webdriver.get_cookies()
获取当前窗口的size(返回字典型):webdriver.get_window_size()

定位操作

id定位：find_element_by_id(id_=‘colorbox’)
xpath定位： find_element_by_xpath(self, xpath)
超链接定位：find_element_by_link_text(self, link_text)
name定位：find_element_by_name(self, name)
tag定位：find_element_by_tag_name(self, name)
class定位：find_element_by_class_name(self, name)
css定位：find_element_by_css_selector(self, css_selector)

注意：
以上定位，返回的都是一个，而且是第一个，将element改为elements返回的是多个或者一个

案例

from selenium.webdriver import Chrome
#输入一个指令，键盘上的按钮，需要导入包：
from selenium.webdriver.common.keys import Keys
# import time


web = Chrome()

web.get("http://lagou.com")

# 找到某个元素，点击它
el = web.find_element_by_xpath('//*[@id="changeCityBox"]/p[1]/a')
el.click() #点击事件

# # 注意
# el = web.find_element_by_name("???")#找到的是第一个
# el = web.find_elements_by_name("???")#找到的是全部

# #注意：在进行操作时，有可能会加载到一个新的页面，有时他的加载速度会比我们的执行速度慢，这就会导制程序报错
# #解决方法：导入time包，让浏览器缓一会
# time.sleep(1) # 让浏览器缓一缓

# 找到输入框，输入python =>输入回车/点击搜索按钮
web.find_element_by_xpath('//*[@id="search_input"]').send_keys("python",Keys.ENTER)

#查找存放数据的位置，进行数据提取
#找到页面中存放数据的所有的item
item_list = web.find_elements_by_xpath('//*[@id="jobList"]/div[1]/div')
for item in item_list:
    job_name = item.find_element_by_xpath('./div[1]/div[1]/div[1]/a').text
    print("工作：",job_name)
    job_company = item.find_element_by_xpath('./div[1]/div[2]/div[1]/a').text
    print('公司：',job_company)
    job_salary = item.find_element_by_xpath('./div[1]/div[1]/div[2]/span').text
    print("工资:",job_salary)
    job_request = item.find_element_by_xpath('//*[@id="jobList"]/div[1]/div[6]/div[1]/div[1]/div[2]').text
    print('要求：',job_request)