目录
1、selenium定位对象(locate elements)
一、python3环境环境
1、方法一:安装python3
在python官网下载:https://www.python.org/downloads/
python3 64位下载:https://www.python.org/ftp/python/3.7.0/python-3.7.0-amd64.exe
python3 32位下载:https://www.python.org/ftp/python/3.7.0/python-3.7.0.exe
双击exe文档安装
特别要注意勾上Add Python 3.7 to PATH,然后点“Install Now”即可完成安装。
2、方法二(比较推荐)-anaconda的安装
anaconda是python发行版本之一,集成了很多工具
官网下载地址:https://www.continuum.io/downloads
官网太慢,可以通过网盘下载:链接:https://pan.baidu.com/s/1ZCP3oLuzwtl-lJ7mIeNYiA 密码:mw93
我的网盘安装包只只用window系统的
anaconda官网使用指南:https://conda.io/docs/user-guide/getting-started.html
anaconda安装方法:http://www.360doc.com/content/16/1029/18/25664332_602357786.shtml
完成安装后,如果你是在windows上操作,在开始栏打开 Anaconda Prompt (一定要点击右键以“”管理员身份证“”打开)
如果没有以管理员身份运行,打开会出现报错
如果安装后,在Anaconda Prompt中都无法使用Conda命令,可以参考这个解决方法:
https://zhuanlan.zhihu.com/p/34337889
如果Anaconda Prompt中可以使用conda命令,接着下面继续操作。
为了避免后面使用报错,你需要先更新下所有包。在终端输入更新所有包的命令:
conda upgrade --all
并在提示是否更新的时候输入 y(Yes)让更新继续。初次安装下的软件包版本一般都比较老旧,因此提前更新可以避免未来不必要的问题。
二、selenium安装
Selenium 是一个自动化测试工具,利用它我们可以驱动浏览器执行特定的动作,如点击、下拉等等操作,对于一些 JavaScript 渲染的页面来说,此种抓取方式非常有效,下面我们来看下 Selenium 的安装过程。
1. 相关链接
官方网站:http://www.seleniumhq.org
GitHub:https://github.com/SeleniumHQ/selenium/tree/master/py
PyPi:https://pypi.python.org/pypi/selenium
官方文档:http://selenium-python.readthedocs.io
中文文档:http://selenium-python-zh.readthedocs.io
2. python3环境下Pip安装
安装selenium前,要先升级pip工具:python -m pip install -U pip
并在提示是否更新的时候输入 y(Yes)让更新继续。初次安装下的软件包版本一般都比较老旧,因此提前更新可以避免未来不必要的问题。】
pip3 install selenium
3. Wheel安装
也可以到 PyPi 下载对应的 Wheel 文件进行安装,https://pypi.python.org/pypi/selenium/#downloads, 如当前最新版本为 3.4.3,则下载 selenium-3.4.3-py2.py3-none-any.whl。
然后进入 Wheel 文件目录,使用 Pip 安装。
pip3 install selenium-3.4.3-py2.py3-none-any.whl
4.anaconda环境下进行安装
conda install selenium
5. 验证安装
进入 Python 命令行交互模式,导入一下 Selenium 包,如果没有报错,则证明安装成功。
$ python3 >>> import selenium
但这样还不够,我们还需要浏览器如 Chrome、Firefox 等浏览器来配合 Selenium 工作。
在后文我们会介绍 Chrome、Firefox、PhantomJS 三种浏览器的配置方式,有了浏览器我们才可以配合 Selenium 进行页面的抓取。
看个人习惯,如果你使用谷歌浏览器,就要配置Chrome的环境
三、chromdrive浏览器驱动安装
在上节我们成功安装好了 Selenium 库,但是它是一个自动化测试工具,需要浏览器来配合它使用,那么本节我们就介绍一下 Chrome 浏览器及 ChromeDriver 驱动的配置。
首先需要下载一个 Chrome 浏览器,方法多样,在此不再赘述。
随后我们需要安装一个 ChromeDriver 才能驱动 Chrome 浏览器完成相应的操作,下面我们来介绍下怎样安装 ChromeDriver。
1. 相关链接
官方网站:https://sites.google.com/a/chromium.org/chromedriver
下载地址:https://chromedriver.storage.googleapis.com/index.html
2. 准备工作
在这之前请确保已经正确安装好了 Chrome 浏览器并可以正常运行,安装过程不再赘述。
3. 查看版本
点击 Chrome 的菜单,帮助->关于 Chrome,即可查看 Chrome 的版本号,如图 1-14 所示: