关于python保存图片的代码

最新推荐文章于 2024-05-13 13:56:11 发布

fanfan19881119

最新推荐文章于 2024-05-13 13:56:11 发布

阅读量950

点赞数

分类专栏： python进行网页下载文章标签： python html解析器 path html url class

本文链接：https://blog.csdn.net/fanfan19881119/article/details/6778514

版权

python进行网页下载专栏收录该内容

0 篇文章 0 订阅

订阅专栏

#from http://hi.baidu.com/%B7%C9%E9%DCfuya/blog/item/a92bcde9285719dcd439c92e.html

import HTMLParser

import urllib
import os
import sys

urlString = "http://www.python.org" //不知道什么原因，当网址换成百度，或是谷歌之后一个是报错，一个是没有反应。

#把图像文件保存至硬盘

def getImage(addr):

    u = urllib.urlopen(addr)

    data = u.read()


    splitPath = addr.split('/')

    path = 'E:\\'

    fName = splitPath.pop()// 此处使用pop来获取图片文件的名称


    print "Saving %s" % fName

    f = open(os.path.join(path,fName), 'wb')// 这个作用是将文件与路径名合并，并且打开文件赋予写的权限

    f.write(data)

    f.close()

#定义HTML解析器

class parseImages(HTMLParser.HTMLParser):

    def handle_starttag(self, tag, attrs):

        if tag == 'img':

            for name,value in attrs:

                if name == 'src':

if 'http' in value:
getImage(value)

''' getImage(urlString + "/" + value)'''// 此处容易在存在不全的url时发生错误，当value里面存在http时就直接下载value即可

#创建HTML解析器的实例

lParser = parseImages()

#打开HTML文件

u = urllib.urlopen(urlString)

print "Opening URL\n===================="

print u.info()

#把HTML文件传给解析器

lParser.feed(u.read())

lParser.close()

下一步就是对于复杂的网页信息进行处理了。

fanfan19881119

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
关于python保存图片的代码

#from http://hi.baidu.com/%B7%C9%E9%DCfuya/blog/item/a92bcde9285719dcd439c92e.htmlimport HTMLParserimport urllibimport osimport sysurlString = "http://www.python.org"//
复制链接

扫一扫