解决Python中zipfile模块解压中文文件名乱码问题
随着Python语言在数据分析、机器学习、人工智能等领域的应用越来越广泛,zipfile模块作为Python标准库中的一个常用模块,在一些场景下也会被使用到。然而,当我们需要解压含有中文文件名的压缩包时,很可能会遇到中文文件名乱码的问题。
针对这个问题,我们可以通过将文件名从gbk编码转换为utf-8编码来进行解决。下面我们提供两种解决方案。
方案一:手动转换编码方式
示例代码如下:
import zipfile
# 设置需要解压的文件名和路径
filename = 'test.zip'
path = './'
# 打开压缩包
with zipfile.ZipFile(filename, 'r') as zip_file:
# 获取所有文件列表
for zip_info in zip_file.infolist():
if zip_info.filename.encode('cp437').decode('gbk')[-1] == '/':
# 如果是文件夹就直接创建目录
zip_file.extract(zip_info, path)
else:
# 如果是文件,先将文件名从gbk编码转换为utf-8编码
zip_info.filename = zip_info.filename.encode('cp437').decode('gbk').encode('utf-8')
# 解压文件
zip_file.extract(zip_info, path)
在上述代码中,我们使用了