python抓取网页数据并截图_Windows下 Python Selenium PhantomJS 抓取网页并截图

安装Python

https://www.python.org/downloads/release

下载安装

将Python目录加入PATH

安装SetupTools

https://pypi.Python.org/pypi/setuptools

下载解压到Python目录并进入

cmd执行Python setup.py install

安装Pip

https://pypi.Python.org/pypi/setuptools

下载解压到Python目录并进入

cmd执行Python setup.py install

安装Selenium

进入Python27\Scripts

cmd执行pip install selenium

安装Geckodriver

https://github.com/mozilla/geckodriver/releases

下载解压exe到Python目录

截取网页(只能截取一页)

from selenium importwebdriverfrom selenium.webdriver.common.keys importKeysimporttimeimportsys

reload(sys)

sys.setdefaultencoding(‘gb18030‘)

driver=webdriver.Firefox()

driver.get("http://www.baidu.com")

elem= driver.find_element_by_name("wd")

elem.send_keys("Eastmount")

elem.send_keys(Keys.RETURN)

time.sleep(2)

driver.save_screenshot(‘baidu.png‘)

driver.close()

driver.quit()

安装PhantomJS

http://phantomjs.org/

下载安装

将目录加入PATH(如果使用有问题则复制exe到Python目录)

截取整个网页

#-*- coding:utf-8 -*-

from selenium importwebdriverfrom urllib importquoteimportsys

reload(sys)

sys.setdefaultencoding(‘utf-8‘)

driver=webdriver.PhantomJS(executable_path="C:\Python27\phantomjs.exe")

url=quote("searchType=song&searchKeyWord=鹿晗 Your Song")

driver.viewportSize={‘width‘:1280,‘height‘:720}

driver.maximize_window()

driver.get("http://www.kugou.com/yy/html/search.html#"+url)

data=driver.title

driver.save_screenshot(‘your.png‘)print data

效果如下

20180111002444669637.png

参考文献:http://blog.csdn.net/comela/article/details/44101203

参考文献:http://blog.csdn.net/eastmount/article/details/47799865

参考文献:http://blog.csdn.net/eastmount/article/details/47023199

参考文献:http://blog.csdn.net/jinhe123/article/details/69946234

参考文献:http://blog.csdn.net/sinat_21302587/article/details/53585527

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值