一个后端服务容器中解压zip包,释放出带文件名带中文的文件,中文显示被?代替,初步推断是服务基础镜像系统字符集出现问题。
进入容器中端界面,手动创建带中文的文件,果不其然,中文显示被?代替了!
进入容器 查看字符集
# docker exec -it /bin/bash
# locale
# locale -a

从输出可以看到,系统使用的是POSIX字符集,POSIX字符集是不支持中文的,而UTF-8是支持中文的 只要把系统中的环境 LANG 改为”UTF-8”格式即可解决问题。
在容器中临时测试
# export LANG="en_US.UTF-8"
手动touch一个带中文的文件,显示正常。
永久设置需在Dockerfile中设置环境字符集环境变量
ENV LANG="en_US.UTF-8"
创建文件的的文件名中文显示问题解决了,程序解压zip包,释放出带文件名带中文的文件名显示乱码问题依然存在。
查阅知道得知,原zip格式并没有指定编码格式,Windows下生成的zip文件中的编码是GBK/GB2312等,因此,导致这些zip文件在Linux下解压时出现乱码问题,因为Linux下的默认编码是UTF-8。
zip这种档案格式1993年出现以来,直到2006年 6

本文介绍了如何解决Docker容器内解压zip文件时出现的中文乱码问题。通过设置容器的环境变量LANG为"en_US.UTF-8"可以解决文件名的乱码,但对于Windows下生成的GBK编码的zip文件,需要在创建时指定Unicode编码或使用7-zip的-mcu选项。同时提供了解压时转换编码的方法和相关参考资料。
最低0.47元/天 解锁文章
3569

被折叠的 条评论
为什么被折叠?



