JAVA解压压缩包后的中文乱码问题

原创 2018年04月17日 16:38:31

java代码对于zip压缩包的解压、压缩等等操作,建议使用zip4j。相关的文章有很多,不再赘述。此处只讨论解压缩之后可能出现的中文乱码问题。

问题代码:

public static void unZip( String zipPath, String destDir ) throws Exception
{
    ZipFile zipFile = new ZipFile( zipPath ) ;
    zipFile.setFileNameCharset( "GBK" ) ;
    zipFile.extractAll( destDir ) ;
}

这段代码正常情况下可以满足大多数压缩包的解压。但是当该压缩包中的文件夹或者文件是以UNICODE编码命名,解压以后就会出现中文乱码问题。
所以我们需要在解压之前就去判断以GBK字符集去解压是否会出现中文乱码,如果有乱码,则采用UNICODE字符集去解压。

正确代码:

public static void unZip( String zipPath, String destDir ) throws Exception
{
    ZipFile zipFile = new ZipFile( zipPath ) ;
    zipFile.setFileNameCharset( getEncoding( zipPath ) ) ;
    zipFile.extractAll( destDir ) ;
}

@SuppressWarnings( "unchecked" )
private static String getEncoding( String path ) throws Exception
{
    String encoding = "GBK" ;
    ZipFile zipFile = new ZipFile( path ) ;
    zipFile.setFileNameCharset( encoding ) ;
    List<FileHeader> list = zipFile.getFileHeaders() ;
    for( int i = 0; i < list.size(); i++ )
    {
        FileHeader fileHeader = list.get( i ) ;
        String fileName = fileHeader.getFileName();
        if( isMessyCode( fileName ) )
        {
            encoding = "UTF-8" ;
            break ;
        }
    }
    return encoding ;
}

private static boolean isMessyCode( String str )
{
    for( int i = 0; i < str.length(); i++ )
    {
        char c = str.charAt( i ) ;
        // 当从Unicode编码向某个字符集转换时,如果在该字符集中没有对应的编码,则得到0x3f(即问号字符?)
        // 从其他字符集向Unicode编码转换时,如果这个二进制数在该字符集中没有标识任何的字符,则得到的结果是0xfffd
        if( (int)c == 0xfffd )
        {
            // 存在乱码
            return true ;
        }
    }
    return false ;
}
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u014298330/article/details/79976983

文件解压和压缩 解决中文乱码

  • 2016年03月12日 11:19
  • 68KB
  • 下载

linux下下载的zip文件解压之后中文文件名乱码

我在下载一些文件的时候,我的ubunt 14.04默认按照zip文件给我打包下载的,但是下载下来之后,发现解压之后我的中文文件名先试试的都为乱码,后来看了其他博客博主的一些解决方法,发现这么一个好的方...
  • u014100559
  • u014100559
  • 2016-10-04 08:30:44
  • 1360

Java实现Zip压缩与解压(解决中文乱码问题)

解决中文压缩与解压问题  使用的是org.apache.tools.zip包下面的相关类  下面是自己写的类,可以设置和获取Zip文件的注释信息  Java代码   [java] ...
  • huningjun
  • huningjun
  • 2015-08-03 18:23:18
  • 2189

Ubuntu系统下解决压缩文件乱码问题

转载自:http://blog.csdn.net/jiangxinyu/article/details/8206395 #################################...
  • u012005313
  • u012005313
  • 2016-03-28 15:48:25
  • 957

在CentOS上解压含有中文名的ZIP文件出现乱码的解决办法

CentOS7下通过yum安装p7zip 现象 云ECS主机上,没有装p7zip,然后通过yum安装,发现也没有这样包。再仔细检查了下,发现本机环境中,没有启用epel源,致使通过yum无法安装p7z...
  • sunxiaopengsun
  • sunxiaopengsun
  • 2016-12-29 22:39:41
  • 1382

解决java中ZipFile解压缩时候的中文路径和乱码问题

JAVA中对jar文件或zip文件解压的时候,可以使用JDK内置的API:JarFile和ZipFile,在windows下解压这2种格式文件的时候,经常报以下错误: Exception in th...
  • aitangyong
  • aitangyong
  • 2014-10-24 17:56:26
  • 5192

Java中解压文件名有中文的rar包出现乱码问题的解决

Java中解压文件名有中文的rar包出现乱码问题的解决 博客分类:  Java   之前一直在用java-unrar-0.3.jar来解压rar文件包,一直很正常,但是今天...
  • p312011150
  • p312011150
  • 2017-07-03 09:31:08
  • 343

Zip压缩解压缩_已解决中文乱码

java zip 压缩 解压
  • xRouter
  • xRouter
  • 2016-04-07 17:41:56
  • 2445

Java 压缩、解压缩文件(中文乱码问题已解决)

鸣谢:http://blog.csdn.net/kalision/article/details/7864372 强力推荐解压:http://blog.csdn.net/smile725775/...
  • bojinyan
  • bojinyan
  • 2015-04-19 10:27:16
  • 2740

ZipInputStream解压有中文名报错问题解决

  • 2010年08月25日 17:22
  • 31KB
  • 下载
收藏助手
不良信息举报
您举报文章:JAVA解压压缩包后的中文乱码问题
举报原因:
原因补充:

(最多只允许输入30个字)