不积跬步无以至千里

生如夏花之灿烂,死如秋叶之静美。

Python学习(二)

利用selenium+phantomjs从百度页面爬简单数据

1、安装selenium。命令pip install selenium==2.53.6(这里一定要指定版本。本教程可能不支持高版本)。安装如下图所示:


2、校验是否安装成功。依次输入命令:python、from selenium import webdriver、webdriver.Firefox()如下面图片所示



这里成功打开了火狐浏览器证明我们的安装是成功的

3、安装phantomjs。下载路径:http://phantomjs.org/download.html 

4、解压下载的安装包phantomjs-2.1.1-windows.zip,我这里将安装包解压到了Python的安装目录(便于管理)

5、配置环境变量,如下图所示


6、打开Windows命令窗口, 

切换路径到需要被运行的js文件的路径下 

7、执行phantomjs hello.js 输出如图所示结果。证明配置正确


8、编写python脚本。我这里的脚本如下:

from selenium import webdriver  
driver = webdriver.PhantomJS(executable_path=r"D:\Python36\phantomjs-2.1.1-windows\bin\phantomjs.exe")  
driver.get("http://www.baidu.com")  
data = driver.title 
print(data)

9、运行的3步的脚本。运行效果如下图所示:


这样我们就完成了一个简单的从百度爬数据的工作

阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u011192409/article/details/80322972
文章标签: Python
个人分类: Python
想对作者说点什么? 我来说一句

树莓派与Python学习(二)

2017年07月26日 5.02MB 下载

自考英语(二)学习软件

2010年01月12日 9.46MB 下载

没有更多推荐了,返回首页

不良信息举报

Python学习(二)

最多只允许输入30个字

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭