用pethon 抓取网站图片代码

最新推荐文章于 2024-04-22 20:30:00 发布

xialingfeixiang

最新推荐文章于 2024-04-22 20:30:00 发布

阅读量517

点赞数

分类专栏： pthon 文章标签： pthon

本文链接：https://blog.csdn.net/xialingfeixiang/article/details/44491029

版权

pthon 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

#!/usr/bin/env python
#coding:utf8
import re,urllib
url='http://www.qq.com/'
def getHtml():
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getImg(html):
    reg = r'<img src="(.*?\.\w{3,4})"'
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    n = 0
    print imglist
    for imgurl in imglist:
        n=n+1
        pic_suffix = imgurl.split('.')[-1]
        if imgurl[0:4] == 'http':
            print imgurl
            urllib.urlretrieve(imgurl,'%d.%s' % (n,pic_suffix))
        else:
            print url + imgurl
            urllib.urlretrieve(url + imgurl,'%d.%s' % (n,pic_suffix))

U=getHtml()
getImg(U)