phantomjs的安装

最新推荐文章于 2024-08-13 16:00:07 发布

《落神》

最新推荐文章于 2024-08-13 16:00:07 发布

阅读量920

点赞数

分类专栏：自动化工具爬虫文章标签： python selenium

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zuo199606184810/article/details/81543254

版权

爬虫同时被 2 个专栏收录

37 篇文章 4 订阅

订阅专栏

自动化工具

12 篇文章 0 订阅

订阅专栏

python爬虫学习过程，前期我们可能会拿一些静态数据网站做操作，所以学起来相对简单一些，但是在实际工作当中我们遇到的数据并不仅仅只是静态的数据（比如淘宝网、京东网等），所以如何爬取动态的数据，是我们学习的重中之重。今天给大家介绍一个python获取动态数据的工具phantomjs，它对于获取动态数据非常实用的，接下来我会向大家如何安装phantomjs。

PhantomJS是一个基于webkit的JavaScript API。它使用QtWebKit作为它核心浏览器的功能，使用webkit来编译解释执行JavaScript代码。任何你可以在基于webkit浏览器做的事情，它都能做到。它不仅是个隐形的浏览器，提供了诸如CSS选择器、支持Web标准、DOM操作、JSON、HTML5、Canvas、SVG等，同时也提供了处理文件I/O的操作，从而使你可以向操作系统读写文件等。PhantomJS的用处可谓非常广泛，诸如网络监测、网页截屏、无需浏览器的 Web 测试、页面访问自动化等。

　　1.在浏览器输入PhantomJS，找到它的官方下载地址：http://phantomjs.org/download.html 进入网页内，选择与本计算机对应的phantomjs，点击下载

2.下载完成后，将压缩文件解压到桌面，并将文件保存到指定的文件夹中，这里我默认的D:\python

3.设置环境变量，将phantomjs所处的路径复制到环境变量设置的path里面，点击确定

在复制路径前一定要用“；”分号隔开，不然在使用phantomis过程中，会一直报错。

phantomjs的基础应用

from selenium import webdriver
# 使用webkit无界面浏览器
# 如果路径为exe启动程序的路径 那么该路径需要加一个 r
driver = webdriver.PhantomJS(executable_path=r'D:/python/phantomjs-2.1.1-windows/bin/phantomjs.exe')
# 获取指定网页的数据
driver.get('http://news.sohu.com/scroll/')
print(driver.find_element_by_class_name('title').text)

phantomjs的使用是和selenium配合使用的，前边我给大家介绍了seleium的安装，如果没有安装selenium，可以参照前面的selenium安装。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

《落神》 CSDN认证博客专家 CSDN认证企业博客

码龄6年

72: 原创

6万+: 周排名

80万+: 总排名

13万+: 访问

: 等级

1490: 积分

69: 粉丝

25: 获赞

14: 评论

127: 收藏

私信

关注

热门文章

分类专栏

验证码付费 3篇
爬虫 37篇
应用工具 9篇
自动化工具 12篇
python语法 19篇
项目部署 4篇
数据库 8篇
代理 1篇
前端 1篇

最新评论

爬取西瓜视频影视分类
2301_79877829: # -*- coding: utf-8 -*- import scrapy import json import xlwt import datetime from ..items import XiguaspiderItem # https://www.ixigua.com/api/pc/feed/?min_behot_time=0&category=subv_xg_movie&utm_source=toutiao&widen=1&tadrequire=true&as=A1356CB8354CB7B&cp=5C85ECBB27BB0E1&_signature=ojnZNhAa.ssIFpm2yASWDqI52S # https://www.ixigua.com/api/pc/feed/?max_behot_time=1552274468&category=subv_xg_movie&utm_source=toutiao&widen=1&tadrequire=true&as=A1157C68A5DD8CE&cp=5C85EDA82C2E5E1&_signature=ojnZNhAa.ssIFpm2yAQSOKI52S """ 西瓜视频：xigua """ class XiguaSpider(scrapy.Spider): name = 'xigua' allowed_domains = ['ixigua.com'] start_urls = ['https://www.ixigua.com/api/pc/feed/?min_behot_time=0&category=subv_xg_movie&utm_source=toutiao&widen=1&tadrequire=true&as=A1153CD8459DA0F&cp=5C85ED8AE0BF1E1&_signature=ojnZNhAa.ssIFpm2yASWDqI52S'] doc_url = 'https://www.ixigua.com/api/pc/feed/?max_behot_time={}&category=subv_xg_movie&utm_source=toutiao&widen=1&tadrequire=true&as=A185AC288847AA0&cp=5C88172A3A40AE1&_signature=YaQQuxAbPTDLi1A75tbnUmGkEK' base_url = 'https://www.ixigua.com' custom_settings &#
爬虫---ins注册脚本
《落神》: 可以，需要能收到验证码的邮箱
爬虫---ins注册脚本
2301_79589025: 可以邮箱批量注册ins账号吗？
爬虫---ins注册脚本
Fan0908: 已私信您，期待回复。
记录：selenium点击“下一页”或“继续阅读”出现的错误以及解决方式
焗芋安: 期待新的解决方法

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。