最近下了一些资料来看,下下来是压缩包格式为zip,但是解压后乱码,乱码格式是这样的:
шп╛хаВф╗гчаБ5
这是什么鬼哦
原因:
zip在压缩时并没有指定编码格式,Windows下生成的zip文件中的编码是GBK/GB2312等,而Linux下的默认编码是UTF8,
所以这些zip文件在Linux下解压时会出现中文乱码问题。
解决的方法:
加上CP936选项,最早的GBK编码,就是IBM定制的MBCS字符集,汉字编码正好在整个字符集中的936页,因此好多地方其实都是用CP936来代表GBK。
unzip -O CP936 sun.zip
指定解压到某个指定目录:
unzip -O CP936 sun.zip -d /root/file