python实现爬图，不要再爬妹子图了，太没品

最新推荐文章于 2024-02-08 17:52:56 发布

han____shuai

最新推荐文章于 2024-02-08 17:52:56 发布

阅读量2.4k

点赞数

分类专栏：科学技术

科学技术专栏收录该内容

47 篇文章 1 订阅

订阅专栏

转自开源中国社区：http://www.oschina.net/code/list

随便找个有图片的网站，比如http://www.u148.net/article/37161.html，运行软件，将网址粘贴进去就行了，回车就行了。（linux下的路径，有需要的改改路径，很简单，做为学习urllib模块的一个简单范例吧）

标签： <无>

   
   # !/usr/bin python
#--*-- coding:utf-8 --*--

'''
批量下载任意网址上的图片
linux下的路径，有需要的改改路径，很简单，做为学习urllib模块的一个简单范例吧
'''
import os
import urllib
import re

url = ""

def getHtml(url):
   file = urllib.urlopen(url)
   html = file.read()
   return html

def getImageList(html):
   reg = 'http[^"]*?\.jpg'
   imgre = re.compile(reg)
   imgList = re.findall(imgre,html)
   return imgList

def printImageList(imgList):
   for i in imgList:
      print i

def download(imgList, page):
   x = 1
   for imgurl in imgList:
      print 'download file '+str(x)+' start'
      urllib.urlretrieve(imgurl,'./webImage/%s_%s.jpg'%(page,x))
      print 'download file '+ str(x)+ ' end'
      x+=1


def downImageNum(pagenum):
   page = 1
   pageNumber = pagenum
   while(page <= pageNumber):
      html = getHtml(url)#获得url指向的html内容
      imageList = getImageList(html)#获得所有图片的地址，返回列表
      printImageList(imageList)#打印所有的图片的地址
      download(imageList,page)#下载所有的图片
      page = page+1

if __name__ == '__main__':
   os.system('mkdir webImage')
   url = raw_input("enter the web page:")
   downImageNum(1)

han____shuai

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python实现爬图，不要再爬妹子图了，太没品

随便找个有图片的网站，比如http://www.u148.net/article/37161.html，运行软件，将网址粘贴进去就行了，回车就行了。（linux下的路径，有需要的改改路径，很简单，做为学习urllib模块的一个简单范例吧）标签： 123456789
复制链接

扫一扫

专栏目录