PhantomJS是一个基于webkit的JavaScript API。它使用QtWebKit作为它核心浏览器的功能,使用webkit来编译解释执行JavaScript代码。它不仅是个隐形的浏览器,还提供了诸如CSS选择器、支持Web标准、DOM操作、JSON、HTML5、Canvas、SVG等,同时也提供了处理文件I/O的操作,从而使你可以向操作系统读写文件等。PhantomJS的用处可谓非常广泛,诸如网络监测、网页截屏、无需浏览器的 Web 测试、页面访问自动化等。
PhantomJS的下载链接:http://phantomjs.org/download.html
安装包下载完成之后,放在一个容易找到位置,然后解压。我的放置地址D:\Python\phantomjs-2.1.1-windows。
这时已经安装完成,运行bin文件夹下的phantomjs.exe
如果出现如下图所示的界面,就表示可以使用了
为了方便使用,可以将phantomjs.exe所在地址添加在环境变量里(注意:在添加之前要先加分号)。
接下来就可以使用啦
这里有一个小例子:
from selenium import webdriver
# 使用webkit无界面浏览器
# 如果路径为exe启动程序的路径 那么该路径需要加一个r
driver = webdriver.PhantomJS(executable_path=r'D:/Python/phantomjs-2.1.1-windows/bin/phantomjs.exe')
# 获取指定网页的数据
driver.get('http://news.sohu.com/scroll/')
print(driver.find_element_by_class_name('title').text)
运行结果:
这样 phantomjs就成功运行了。