利用python中的zipfile
模块解压zip文件会出现文件名乱码的问题,会成为莫名的字符,例如:
出现原因:
zipfile模块中的源代码如下:
if flags & 0x800:
# UTF-8 file names extension
filename = filename.decode('utf-8')
else:
# Historical ZIP filename encoding
filename = filename.decode('cp437')
可知,除了被正确识别,转为'utf-8'
编码,除此之外的所有都将被转成‘cp437’
解决思路:
先将zip文件用extract()/extractall()
方法正常解压至目标文件夹,利用encode(),decode()
方法进行转码,最后用os.rename(src,dst)
函数将文件重命名。
具体代码如下:
def change_name(filename):
os.chdir(filename)
for i in os.listdir("."):
try:
test_name=i.encode("cp437")
test_name=test_name.decode("gbk")#将文件名转为gbk中文编码
os.rename(i,test_name)#重命名
i=test_name
except:
pass
if os.path.isdir(i):#如果解压后的是一个文件夹
change_name(i)
os.chdir('..')