python selenium+Firefox 模拟浏览器操作

Python安装selenium,配置火狐浏览器环境

    火狐浏览器直接从网上下载即可,

    geckodriver的下载链接:https://github.com/mozilla/geckodriver/releases

下载完毕后,将火狐浏览器安装,安装为默认的地址 C:\Program Files\Mozilla Firefox;安装完成后,将火狐浏览器打开,配置selenium IDE插件。

 

第一步:打开火狐浏览器,找到最右边的菜单,选择附加组件,如图所示:

 

 

 

第二步:打开附件组件,选择“获取附件组件”,在搜索框中搜索selenium IDE

 

 

 第三步:找到selenium IDE添加到Firefox,进行安装;

 

 

第四步:安装过后,重新启动浏览器,在工具列表下就会出现Selenium IDE;

selenium IDE的插件就安装好了,点击启用就可以录制脚本了。

 

第五步:将下载好的geckodriver解压后,将geckodriver.exe放在安装过火狐浏览器的目录下,C:\Program Files\Mozilla Firefox

  

 

这时,再次编译代码,就可以成功了。。。。。。。。。

import json
import re
import time

from bs4 import BeautifulSoup
from selenium import webdriver

from selenium.webdriver.firefox.firefox_binary import FirefoxBinary


brower = webdriver.Firefox(executable_path=r'C:\Program Files\Mozilla Firefox\geckodriver.exe')

#打开百度搜索
brower.get("http://www.baidu.com")
#将查询条件赋值给查询文本框
brower.find_element_by_id('kw').send_keys('selenium')
#点击查询操作
brower.find_element_by_id('su').click()
#等待3秒,页面内容太多,有时加载比较慢
time.sleep(3)
#获取当前查询页面所有数据
html=brower.page_source

content=BeautifulSoup(html,'html5lib')
row4=content.select("#4")[0]
#打印第4条查询结果
print(row4)

pattern = re.compile(" class=\"c-abstract\">(.+?)<em>", re.S)
ressource = re.findall(pattern, str(row4))[0]
#打印第4条查询结果的内容
print(ressource)
brower.close()
 
     
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值