网络爬虫 - 7 requests的使用与selenium自动化测试工具

1.selenium+phantomjs

(1)selenium概念: 是一个浏览器的自动化测试工具,通过selenium提供的一些方法可以去操作浏览器,让浏览器做 一些自动化的工作
(2)selenium操作谷歌浏览器: 主要核心:而是selenium操作谷歌浏览器驱动,通过驱动再来操作浏览器

谷歌浏览器驱动下载地址
    http://chromedriver.storage.googleapis.com/index.html
    http://npm.taobao.org/mirrors/chromedriver/
谷歌驱动和谷歌浏览器版本关系映射表
    http://blog.csdn.net/huilan_same/article/details/51896672
安装selenium:pip install selenium



【注】通过selenium操作浏览器的时候,一定要记得停顿,因为是真正的上网过程,要执行其中很多的请求,所以使用selenium非常的慢,效率低.

(3)selenium操作有界面的目的
phantomjs概念: 是一款浏览器,它是一款无界面浏览器。就是专门用来写爬虫代码用的。肯定有浏览器的功能,可以将html、css、图片、js给你显示成图文并茂的形式,phantomjs可以执行网页中的js代码。
网页的呈现形式,很多情况,html中的内容不是直接就有的,而是需要执行js代码,动态的给生成的
(a

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值