python实现爬图,不要再爬妹子图了,太没品

转自开源中国社区:http://www.oschina.net/code/list
随便找个有图片的网站,比如http://www.u148.net/article/37161.html,运行软件,将网址粘贴进去就行了,回车就行了。(linux下的路径,有需要的改改路径,很简单,做为学习urllib模块的一个简单范例吧)
标签: <无>
   
   
# !/usr/bin python
#--*-- coding:utf-8 --*--

'''
批量下载任意网址上的图片
linux下的路径,有需要的改改路径,很简单,做为学习urllib模块的一个简单范例吧
'''
import os
import urllib
import re

url = ""

def getHtml(url):
   file = urllib.urlopen(url)
   html = file.read()
   return html

def getImageList(html):
   reg = 'http[^"]*?\.jpg'
   imgre = re.compile(reg)
   imgList = re.findall(imgre,html)
   return imgList

def printImageList(imgList):
   for i in imgList:
      print i

def download(imgList, page):
   x = 1
   for imgurl in imgList:
      print 'download file '+str(x)+' start'
      urllib.urlretrieve(imgurl,'./webImage/%s_%s.jpg'%(page,x))
      print 'download file '+ str(x)+ ' end'
      x+=1


def downImageNum(pagenum):
   page = 1
   pageNumber = pagenum
   while(page <= pageNumber):
      html = getHtml(url)#获得url指向的html内容
      imageList = getImageList(html)#获得所有图片的地址,返回列表
      printImageList(imageList)#打印所有的图片的地址
      download(imageList,page)#下载所有的图片
      page = page+1

if __name__ == '__main__':
   os.system('mkdir webImage')
   url = raw_input("enter the web page:")
   downImageNum(1)



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值