Selenium介绍和Selenium WebDriver安装
前言:本来是打算在完成一阶段爬虫学习的时候再对此章节进行总结,但是因为在使用selenium模块的时候遇到了浏览器类型和webdriver的兼容性问题,在经过近1天的排列组合搭配后终将此问题解决,于是决定对selenium模块进行一次总结。
前置知识:
- Python爬虫
1. selenium是什么
- selenium中文网
- selenium 是
web自动化测试工具集
,包括IDE、Grid、RC(selenium 1.0)、WebDriver(selenium 2.0)等,其中就有包括模拟用户访问浏览器对web网站进行访问的模块,而在python中可以通过调用webdriver实现。不仅仅是python,也同时支持多种编程语言。而在python中可以利用selenium中的webdriver对浏览器进行交互,从而实现浏览器爬取网页内容的过程。
- selenium IDE 是是firefox浏览器的一个插件。提供简单的脚本录制、编辑与回放功能。如果有需要的话可以自行下载Selenium IDE
- WebDriver 这里可以理解为一套规范,在这套规范里定义客户端脚步与浏览器交互的协议。(例如下面通过webdriver调用浏览器进行爬虫,并通过id获取html中指定元素)