python 查询oss阿里云bucket日志数据生成csv文件

最新推荐文章于 2022-05-12 10:41:28 发布

狗哥不太狗

最新推荐文章于 2022-05-12 10:41:28 发布

阅读量377

点赞数

分类专栏：技术文章标签： python

本文链接：https://blog.csdn.net/qq_15115793/article/details/107917785

版权

技术专栏收录该内容

11 篇文章 0 订阅

订阅专栏

python 查询oss阿里云bucket日志数据


# -*- coding: utf-8 -*
import oss2
import pandas as pd


access_key_id =  'xxxxxxxxxxx'
access_key_secret =  'xxxxxxxxxxx'
endpoint =  'xxxxxxxxxxx'
bucker_name = 'xxxxxxxxx'


def bucketInfo(bucket):               #获取整个bucket信息
    print("=========   获取bucket_info ==========")
    # 获取bucket相关信息
    bucket_info = bucket.get_bucket_info()
    print(' bucket_info:')
    print(' bucket name: ' + bucket_info.name)
    print(' bucket storage class: ' + bucket_info.storage_class)
    print(' bucket creation date: ' + bucket_info.creation_date)

    print("bucket_stat:")
    bucket_stat = bucket.get_bucket_stat()
    print(' bucket storage: ' + str(bucket_stat.storage_size_in_bytes))
    print(' bucket object count: ' + str(bucket_stat.object_count))
    print(' bucket multi part upload count: ' + str(bucket_stat.multi_part_upload_count))


def fileInfo(bucket,path):
    # 列举存储空间下所有文件。
    for obj in oss2.ObjectIterator(bucket,delimiter=path):
        if obj.is_prefix():  # 文件夹
            dicInfo(bucket,obj.key)
        else:  # 文件
            print('file:' + obj.key + '  length:' + str(obj.size) + "Byte.")
            Data[obj.key] = obj.size

def dicInfo(bucket,folder):
    for obj in oss2.ObjectIterator(bucket, prefix=folder):
        if obj.is_prefix():  # 文件夹
            dicInfo(bucket, obj.key)
        else:  # 文件
            print('file:' + obj.key + '  length:' + str(obj.size) + "Byte.")
            Data[obj.key] = obj.size

def changeSize(size):
    '''
    递归实现，精确为最大单位值 + 小数点后三位
    '''

    units = ['B', 'KB', 'MB', 'GB', 'TB', 'PB']
    integer, remainder, level = strofsize(size, 0, 0)
    if level + 1 > len(units):
        level = -1
    return ('{}.{:>03d} {}'.format(integer, remainder, units[level]))

def strofsize(integer, remainder, level):
    if integer >= 1024:
        remainder = integer % 1024
        integer //= 1024
        level += 1
        return strofsize(integer, remainder, level)
    else:
        return integer, remainder, level

def delBucketFile(bucket,files): #每次最多删除1000个文件。 files = ["filename","filename1",......]
    num = len(files)
    count = num // 1000
    if num % 1000 > 0:
        count += 1
    for i in range(count):
        delFiles = files[i*1000:(i+1)*1000]
        result = bucket.batch_delete_objects(delFiles)
        # 打印成功删除的文件名。
        print('\n'.join(result.deleted_keys))


if __name__ == "__main__":
    auth = oss2.Auth(access_key_id, access_key_secret)
    bucket = oss2.Bucket(auth, endpoint, bucket_name)
    Data = {}
    bucketInfo(bucket)
    fileInfo(bucket, '/')

    if len(Data) > 0:
        values = sorted(Data.items(), key=lambda d: d[1],reverse=True)#按照日志文件大小降序
        names = []
        datas = []
        for t in values:
            names.append(t[0])
            datas.append(changeSize(t[1]))

        dataframe = pd.DataFrame({'文件路径': names, '文件大小': datas})        #生成csv文件
        dataframe.to_csv("bucket.csv", index=False, sep=',')

狗哥不太狗

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 查询oss阿里云bucket日志数据生成csv文件

python 查询oss阿里云bucket日志数据# -*- coding: utf-8 -*import oss2import pandas as pdaccess_key_id = 'xxxxxxxxxxx'access_key_secret = 'xxxxxxxxxxx'endpoint = 'xxxxxxxxxxx'bucker_name = 'xxxxxxxxx'def bucketInfo(bucket): #获取整个bucket信息
复制链接

扫一扫