项目场景:
之前使用zipfile解决了中文乱码问题,代码如下:
import os
target_folder = os.path.dirname(parse_path)
with zipfile.ZipFile(parse_path, 'r') as zip_ref:
for file_info in zip_ref.infolist():
# 解决中文文件名乱码问题
file_info.filename = file_info.filename.encode('cp437').decode('gbk')
zip_ref.extract(file_info, target_folder)
问题描述
如今linux系统中在面对特殊字符时也会报错,比如遇到“ · ”时就会报错。报错内容为:
解压缩时发生未知错误:'charmap' codec can't encode characters in postion 10-11:character maps to <undefined>
本解压操作系统是linux系统,因此改为使用unzip命令解压缩,采用这种方式可以处理特殊和中文字符。代码如下:
解决方案:
linux系统采用unzip命令解压,代码如下:
import os
import subprocess
target_folder, _ = os.path.splitext(file_path)
if os.path.exists(file_path):
# 调用unzip命令并指定编码方式为CP936
command = ["unzip", "-O", "CP936", file_path, "-d", "/root/target_folder"]
try:
# 执行命令
subprocess.run(command, check=True)
print("解压缩完成")
except subprocess.CalledProcessError as e:
print("解压缩失败:", e)