序:
假期在学校安排的实习中,开始对python网络爬虫有了接触。以Eclipse编译器进行配置,来实现python网络爬虫。
本文介绍如何初始化一个webdriver实例对象driver,然后打开和关闭浏览器。要用selenium打开Firefox或者Chrome浏览器。
首先需要去下载一个driver插件geckodriver.exe/chromedriver.exe,可自行在网上搜索与自己浏览器版本相对应的插件,
下载好这个exe文件后,把这个文件放到你的python安装目录下,
例如:C:\Users\xyz\AppData\Local\Programs\Python\Python36\Scripts\chromedriver.exe。
进入Eclipse,点击File—>New—>PyDev Project,创建一个新的项目:
右击FristTest—>New—>PyDev Module:
创建自己 *.py 文件,写入:
#coding:utf-8
from selenium import webdriver
dr = webdriver.Chrome() #打开谷歌浏览器
#dr = webdriver.Firefox()
url="http://www.baidu.com"
dr.get(url)
print("浏览百度完成")
运行结果:
自动化控制页面: