python抓取网页中图片并保存到本地

#-*-coding:utf-8-*- 


import os
import uuid
import urllib2
import cookielib


'''获取文件后缀名'''
def get_file_extension(file):  
    return os.path.splitext(file)[1]  


'''創建文件目录,并返回该目录'''
def mkdir(path):
    # 去除左右两边的空格
    path=path.strip()
    # 去除尾部 \符号
    path=path.rstrip("\\")


    if not os.path.exists(path):
        os.makedirs(path)
        
    return path


'''自动生成一个唯一的字符串,固定长度为36'''
def unique_str():
    return str(uuid.uuid1())


'''
抓取网页文件内容,保存到内存


@url 欲抓取文件 ,path+filename
'''
def get_file(url):
    try:
        cj=cookielib.LWPCookieJar()
        opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
        urllib2.install_opener(opener)q
        
        req=urllib2.Request(url)
        operate=opener.open(req)
        data=operate.read()
        return data
    except BaseException, e:
        print e
        return None
    
'''
保存文件到本地


@path  本地路径
@file_name 文件名
@data 文件内容
'''
def save_file(path, file_name, data):
    if data == None:
        return
    
    mkdir(path)
    if(not path.endswith("/")):
        path=path+"/"
    file=open(path+file_name, "wb")
    file.write(data)
    file.flush()
    file.close()
 


#获取文件后缀名
print get_file_extension("123.jpg");


#創建文件目录,并返回该目录
#print mkdir("d:/ljq")


#自动生成一个唯一的字符串,固定长度为36
print unique_str()


url="http://qlogo1.store.qq.com/qzone/416501600/416501600/100?0";
save_file("d:/ljq/", "123.jpg", get_file(url))
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值