pandas文件压缩：输出两个csv压缩文件并再次压缩

lytcreate.

已于 2024-02-26 14:46:25 修改

阅读量220

点赞数 3

分类专栏： Python 大数据文章标签： pandas

于 2024-02-26 14:44:54 首次发布

本文链接：https://blog.csdn.net/qq_35204012/article/details/136299138

版权

Python 同时被 2 个专栏收录

64 篇文章 1 订阅

订阅专栏

大数据

12 篇文章 0 订阅

订阅专栏

解决思路：

1.输出2个文件为csv.gz，进行首次压缩

2.对两个文件再次进行zip压缩，格式为.zip


def zip_cell_file(file1, file2, zip_file):
    with zipfile.ZipFile(zip_file, 'w') as z:
        z.write(file1)
        z.write(file2)


if __name__ == '__main__':
    file1 = '/data/1.csv.gz'
    file2 = '/data/2.csv.gz'
    zip_file = '/data/3.zip'

    data_frame1.to_csv(file1, index=False, sep=',', encoding='utf-8-sig', compression='gzip')

    data_frame2.to_csv(file2, index=False, sep=',', encoding='utf-8-sig', compression='gzip')
    
    # 压缩文件
    zip_cell_file(file1 , file12, zip_file)

处理完后会在/data目录下生成一个3.zip文件，解压后发现有个data目录，里面才是需要的1.csv.gz和2.csv.gz，故而进行优化添加arcname属性值：

def zip_cell_file(file1, file2, zip_file):
    with zipfile.ZipFile(zip_file, 'w') as z:
        z.write(file1, arcname=file1.split('/')[-1])
        z.write(file2, arcname=file2.split('/')[-1])

优化后，解压/data/3.zip 后可得到1.csv.gz和 2.csv.gz，可再次进行解压得到里面的1.csv和 2.csv