Python安装selenium,配置火狐浏览器环境
火狐浏览器直接从网上下载即可,
geckodriver的下载链接:https://github.com/mozilla/geckodriver/releases
下载完毕后,将火狐浏览器安装,安装为默认的地址 C:\Program Files\Mozilla Firefox;安装完成后,将火狐浏览器打开,配置selenium IDE插件。
第一步:打开火狐浏览器,找到最右边的菜单,选择附加组件,如图所示:
第二步:打开附件组件,选择“获取附件组件”,在搜索框中搜索selenium IDE
第三步:找到selenium IDE添加到Firefox,进行安装;
第四步:安装过后,重新启动浏览器,在工具列表下就会出现Selenium IDE;
selenium IDE的插件就安装好了,点击启用就可以录制脚本了。
第五步:将下载好的geckodriver解压后,将geckodriver.exe放在安装过火狐浏览器的目录下,C:\Program Files\Mozilla Firefox;
这时,再次编译代码,就可以成功了。。。。。。。。。
import json import re import time from bs4 import BeautifulSoup from selenium import webdriver from selenium.webdriver.firefox.firefox_binary import FirefoxBinary brower = webdriver.Firefox(executable_path=r'C:\Program Files\Mozilla Firefox\geckodriver.exe') #打开百度搜索 brower.get("http://www.baidu.com") #将查询条件赋值给查询文本框 brower.find_element_by_id('kw').send_keys('selenium') #点击查询操作 brower.find_element_by_id('su').click() #等待3秒,页面内容太多,有时加载比较慢 time.sleep(3) #获取当前查询页面所有数据 html=brower.page_source content=BeautifulSoup(html,'html5lib') row4=content.select("#4")[0] #打印第4条查询结果 print(row4) pattern = re.compile(" class=\"c-abstract\">(.+?)<em>", re.S) ressource = re.findall(pattern, str(row4))[0] #打印第4条查询结果的内容 print(ressource)
brower.close()