Phantomjs作用:
PhantomJS的适用范围就是无头浏览器的适用范围。通常无头浏览器可以用于页面自动化,网页监控,网络爬虫等:
- 页面自动化测试:希望自动的登陆网站并做一些操作然后检查结果是否正常。
- 网页监控:希望定期打开页面,检查网站是否能正常加载,加载结果是否符合预期。加载速度如何等。
- 网络爬虫:获取页面中使用js来下载和渲染信息,或者是获取链接处使用js来跳转后的真实地址。
Phantomjs官网下载地址:http://phantomjs.org/download.html
1.打开链接后单击此处进行文件下载:
2. 下载完成后找到此压缩包并解压,找到解压后的文件夹并进入‘phantomjs-2.1.1-windows\bin’
3.然后复制当前路径,右击“我的电脑”-‘属性’-‘高级系统设置’
4.选择‘环境变量’
5.选择‘Path’,单击‘编辑’
6.点击‘新建’,然后在此处添加刚才的路径后单击,确定
7.打开Pycharm新建一个.py文件,执行以下代码,测试能否成功获取数据
from selenium import webdriver #引入网页驱动包
driver = webdriver.PhantomJS(executable_path=r'D:/Python/phantomjs-2.1.1-windows/bin/phantomjs.exe')# 使用webkit无界面浏览器,如果路径为EXE启动程序的路径 那么该路径需要加一个r
driver.get('http://news.sohu.com/scroll/') # 获取指定网页的数据
print(driver.find_element_by_class_name('title').text)
运行结果 :
粗心!欧巡将弗利特伍德公开赛奖金转给同名球手