python网络爬虫抓取图片

最新推荐文章于 2024-04-16 22:07:34 发布

longshengguoji

最新推荐文章于 2024-04-16 22:07:34 发布

阅读量3.3w

点赞数 5

分类专栏：编程语言文章标签： python 网络爬虫图片 HTML

本文链接：https://blog.csdn.net/longshengguoji/article/details/9946675

版权

编程语言专栏收录该内容

97 篇文章 7 订阅

订阅专栏

利用python抓取网络图片的步骤：

1.根据给定的网址获取网页源代码

2.利用正则表达式把源代码中的图片地址过滤出来

3.根据过滤出来的图片地址下载网络图片

import re
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getImg(html):
    reg = r'src="(.+?\.jpg)" pic_ext'
    imgre = re.compile(reg)
    imglist = imgre.findall(html)
    x = 0
    for imgurl in imglist:
        urllib.urlretrieve(imgurl,'%s.jpg' % x)
        x = x + 1        
   
html = getHtml("http://tieba.baidu.com/p/2460150866")
getImg(html)

longshengguoji

关注

5
点赞
踩
17

收藏

觉得还不错? 一键收藏
8
评论
python网络爬虫抓取图片

利用python抓取网络图片的步骤：1.根据给定的网址获取网页源代码2.利用正则表达式把源代码中的图片地址过滤出来3.根据过滤出来的图片地址下载网络图片import reimport urllibdef getHtml(url): page = urllib.urlopen(url) html = page.read() return htmlde
复制链接

扫一扫