PhantomJS简介:
(1)一个基于webkit内核的无头浏览器,即没有UI界面,即它就是一个浏览器,只是其内的点击、翻页等人为相关操作需要程序设计实现。
(2)提供javascript API接口,即通过编写js程序可以直接与webkit内核交互,在此之上可以结合java语言等,通过java调用js等相关操作,从而解决了以前c/c++才能比较好的基于webkit开发优质采集器的限制。
(3)提供windows、linux、mac等不同os的安装使用包,也就是说可以在不同平台上二次开发采集项目或是自动项目测试等工作。
PhantomJS安装:
(1)下载链接:http://phantomjs.org/download.html,打开网页后下载合适的版本
(2)下载完成后是一个压缩包,解压到你认为比较合适的地方
这里推荐解压到python的IDE或者安装环境的同级文件夹中,就像我这样
(3)修改环境变量(重点)
第一种方法:
1、找到phantomjs.exe文件,打开你刚刚解压的文件夹,找到并打开bin文件夹
phantomjs-2.1.1-windows >>> bin
2、复制phantomjs.exe的文件路径
3、修改环境变量
① 在开始菜单搜索 环境变量,并点击编辑系统环境变量
②点击 环境变量,在系统变量中找到Path,并点击编辑
③如果你不是windows10系统,你需要在最后面先加一个分号(;),再追加你刚刚复制的路径
windows10可以直接在最后面追加路径
然后确定就行了
4、验证是否成功
双击phantomjs.exe文件,如果是以下形式,则安装成功
第二种方法:这种方法适用于曾经修改过python的安装环境的环境变量
1、找到phantomjs.exe文件,复制一份
2、粘贴到安装环境的环境变量的路径中
在Python中的具体使用方法
phantomjs属于selenium库,所以使用方法很简单
from selenium import webdriver
driver=webdriver.PhantomJS(executable_path=r'E:/Python/phantomjs-2.1.1-windows/bin/phantomjs.exe')
driver.get('http://news.sohu.com/scroll/')
print(driver.find_element_by_class_name('title').text)
当调用PhantomJS时需要设置参数路径
这就是PhantomJS的安装和使用了