都知道Python的语法很简单易上手,也很适合拿来作爬虫等等,这里就简单讲解一下爬虫入门——简单地爬取下载网站图片。html
效果
就像这样自动爬取下载图片到本地:python

代码:
其实很简单,咱们直接看下总体的代码:web
#coding = utf-8
import urllib
import re
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
def getImg(html):
reg = 'src="(.+?\.jpg)" alt='
imgre = re.compile(reg)
imglist = re.findall(imgre, html)
x = 0
for imgurl in imglist:
urllib.urlretrieve(imgurl, '%s.jpg' % x)
x+=1
return imglist
html = getHtml("http://pic.yxdown.com/list/0_0_1.html")

本文介绍了一种使用Python进行简单图片爬取的方法。通过导入urllib和re库,模拟浏览器请求网页并解析HTML,利用正则表达式获取图片URL,最后使用urlretrieve函数下载图片到本地。该教程适合Python初学者了解爬虫基本操作。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



