PhantomJS
前面使用selenium库,在得到页面代码的同时会有页面弹出,如果需要爬取的页面很多,这样一直弹出页面,也会有影响。那么,我需要一个无界面的运营模式——phantomjs
01.下载安装包
自行下载所需的安装包
下载地址
02.配置环境变量
下载完成后解压缩,在bin目录下找到phantomjs.exe文件,将其路径配置到系统/用户环境变量中去。为安全起见,我是两个都配置了,以前要是配置过环境变量的话,我这里就不多说了。
03.测试
1)重新打开命令行,输入phantomjs就可以进入交互模式了
进入2)Python解释器,声明一个PhantomJS的对象,进行网页获取
3)执行到这里会出现一个安全警报
我们选择允许访问
4)继续输入
driver.get('http://www.baidu.com')
等待一会,我们发现这次并没有像Chrome一样自动跳出页面
5)然后,输入
driver.page_source
打印一下刚才获取的网页JS信息
PhantomJS安装完成!!!