python简单的图片下载小爬虫

最新推荐文章于 2023-12-18 15:06:41 发布

lvbaolin123

最新推荐文章于 2023-12-18 15:06:41 发布

阅读量545

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/lvbaolin123/article/details/52659275

版权

python 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

功能：

通过http获取到页面的html代码，然后通过正则找到图片的链接，最后进行循环下载

新建一个getjpg.py的文件，在这个文件中输入一下代码：

import re
import urllib

def getHtml(url):
        page=urllib.urlopen(url)
        html=page.read()
        return html

def getImage(html):
        reg=r'src="(.*?\.jpg)"'
        imgre=re.compile(reg)
        imglist=re.findall(imgre,html)
        x=0
        for imgurl in imglist:
                urllib.urlretrieve(imgurl,'%s.jpg' % x)
                x+=1

html=getHtml("http://www.wmpic.me/tupian/wmpic")
getImage(html)