Python学习(二)

利用selenium+phantomjs从百度页面爬简单数据

1、安装selenium。命令pip install selenium==2.53.6(这里一定要指定版本。本教程可能不支持高版本)。安装如下图所示:

2、校验是否安装成功。依次输入命令:python、from selenium import webdriver、webdriver.Firefox()如下面图片所示

这里成功打开了火狐浏览器证明我们的安装是成功的

3、安装phantomjs。下载路径:http://phantomjs.org/download.html 

4、解压下载的安装包phantomjs-2.1.1-windows.zip,我这里将安装包解压到了Python的安装目录(便于管理)

5、配置环境变量,如下图所示

6、打开Windows命令窗口, 

切换路径到需要被运行的js文件的路径下 

7、执行phantomjs hello.js 输出如图所示结果。证明配置正确

8、编写python脚本。我这里的脚本如下:

from selenium import webdriver  
driver = webdriver.PhantomJS(executable_path=r"D:\Python36\phantomjs-2.1.1-windows\bin\phantomjs.exe")  
driver.get("http://www.baidu.com")  
data = driver.title 
print(data)

9、运行的3步的脚本。运行效果如下图所示:

这样我们就完成了一个简单的从百度爬数据的工作

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

JAIR_FOREVER

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值