python第三方库--selenium库

简介

selnium是一个自动化测试工具,支持各种浏览器,简单的说就是selenium可以操作浏览器,加载一些需要动态加载的界面
安装selenium库后还需要安装对应浏览器的驱动
selenium webdriver的基本操作
定位到元素后,还需要进行以下相应的操作,下面介绍一些常用的方法

常用方法

方法描述示例
get(url)访问urldriver.get('http://www.baidu.com')
back()后退上一步driver.back()后退上一个网页,类似于:←
forward()前进下一步driver.format()与back()相反,类似于:→
quit()退出驱动关闭所有窗口driver.quit()关闭所有窗口
close()关闭当前窗口driver.close()关闭当前打开的窗口
maximize_window()浏览器最大化
refresh()刷新浏览器driver.refresh()刷新浏览器

元素操作

方法描述示例
send_keys()向文本框类型中输入数据driver.find_element('input').send_keys('123') 向input输入框中输入123
clear()清空输入的数据driver.find_element(‘tag’,'input').clear() 清空input框中的内容
click()单击事件driver.find_element('tag','input').click()
enter()触发键盘的enter操作driver.find_element('tag','input').enter()
text()获取元素的文本内容driver.find_element('id','name').text(),返回name的文本
page_source获取页面的HTML内容driver.page_source() 获取网页的html

cookie操作

方法简介示例
get_cookies()获取当前页面的所有cookiesdirver.get_cookies() 获得页面所有的cookie
add_cookie()添加cookiedriver.add_cookie('time','1612354154.7383971'),添加一个time为1612354154.7383971的cookie
delete_cookie()删除一条cookiedriver.delete_cookie('time') 删除名称为time的cookie
delete_all_cookies()删除所有cookiedriver.delete_cookies() 删除所有cookie

案例:获取拉勾网的招聘信息

from selenium import webdriver
import time
from bs4 import BeautifulSoup
import re
class Job:		# 建立一个工作类
    def __init__(self):
        self.name=None
        self.company=None
        self.condition=None
        self.salary=None
    def get(self):
        return (self.name,self.company,self.condition,self.salary)
class Lagou:
    def __init__(self):
        self.driver=webdriver.Chrome()
        self.driver.maximize_window()
        self.url='http://www.lagou.com/'
    def search(self,keyword):
        self.driver.get(self.url)
        time.sleep(3)
        self.driver.find_element('id','cboxClose').click()
        time.sleep(3)
        self.driver.find_element('id','search_input').send_keys(keyword)
        self.driver.find_element('id','search_button').click()
        time.sleep(2)
        page_source=self.driver.page_source
        self.driver.quit()
        return page_source
    def get_jobs(self,page_source):
        soup=BeautifulSoup(page_source,'html.parser')
        myjob=Job()		# 实例化每一个工作并进行信息存储
        hot_item=soup.find_all('li',class_=re.compile('con_list_item'))
        for item in hot_item:
            myjob.name=item.find('h3').get_text().strip()	# 去除字符两端的空白字符
            myjob.company=item.select_one('.company_name>a').get_text().strip()
            myjob.salary=item.select_one('.money').get_text().strip()
            myjob.condition=item.find('div',class_='industry').get_text().strip()
            print(myjob.get())
if __name__ == '__main__':
    hot=Lagou()
    time.sleep(5)
    page_source=hot.search('python')
    hot.get_jobs(page_source)

运行结果
在这里插入图片描述

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

夺笋123

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值