python 入门级别爬虫
目的:爬取游民星空的图片
前两天在游民星空看到几张美图,然后就想把它保存下来,但是一个一个的右键保存,太不爽了,身为一个程序源,一个码农,怎么能这么低级的保存呢?
然后最近在学python,刚入门,然后就忍不住用python把图片都给抓下来了,哈哈,python就是这么顺手
话不多说,源码奉上:
# !/usr/bin/python
# -*- coding:UTF-8 -*-
import urllib
import re
#获取网页的函数
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
#获取图片列表的函数,并对图片列表进行遍历,然后将图片存盘到本地
def getImg(html,count):
# reg = r'"http.+?\.jpg'
imgre = re.compile(r'src="(http.+?\.jpg)">')
imglist = re.findall(imgre,html)
x = 0
for imgurl in imglist:
urllib.urlretrieve(imgurl,'_picture_JM_%s_%s.jpg' % (x,count))
x+=1
#html = get