python 解压zip 慢_python解压非常慢?

博主发现使用Python低级方法解压ZIP文件效率不高,通过研究zipfile对象的方法,发现'extractall'类似tarfile的提取功能。在MacOSx 10.5上,对一个84.6MB的ZIP文件进行解压,使用timeit模块测试,耗时约2秒,性能表现良好。
摘要由CSDN通过智能技术生成

我也在用Python解压/解压/解压zip文件,而那种“创建zip file对象,遍历其.namelist(),读取文件并将其写入文件系统”的低级方法似乎不是很Python。所以我开始挖掘zipfile objects我认为没有很好的文档记录,并涵盖了所有的对象方法:>>> from zipfile import ZipFile

>>> filepath = '/srv/pydocfiles/packages/ebook.zip'

>>> zip = ZipFile(filepath)

>>> dir(zip)

['NameToInfo', '_GetContents', '_RealGetContents', '__del__', '__doc__', '__enter__', '__exit__', '__init__', '__module__', '_allowZip64', '_didModify', '_extract_member', '_filePassed', '_writecheck', 'close', 'comment', 'compression', 'debug', 'extract', 'extractall', 'filelist', 'filename', 'fp', 'getinfo', 'infolist', 'mode', 'namelist', 'open', 'printdir', 'pwd', 'read', 'setpassword', 'start_dir', 'testzip', 'write', 'writestr']

我们开始了,“extractall”方法的工作方式就像tarfile's extractall!(在Python2.6和2.7上,但不是2.5)

然后是性能问题;ebook.zip文件是84.6mb(主要是pdf文件),未压缩文件夹是103mb,默认情况下在MacOSx 10.5下压缩为“存档实用程序”。所以我对Python的timeit模块也做了同样的操作:>>> from timeit import Timer

>>> t = Timer("filepath = '/srv/pydocfiles/packages/ebook.zip'; \

... extract_to = '/tmp/pydocnet/build'; \

... from zipfile import ZipFile; \

... ZipFile(filepath).extractall(path=extract_to)")

>>>

>>> t.timeit(1)

1.8670060634613037

在一台拥有90%内存的重负载机器上,其他应用程序正在使用它不到2秒。

希望这能帮助别人。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值