linux解压含中文名的文件夹,请问,为什么zip包中的中文文件名解压后是乱码? - LinuxSir.Org...

博主发现Unzip在解压由Winzip压缩的包含中文文件名的.zip文件时出现问题,经过一系列实验和源码分析,确定问题在于Unzip对文件名的处理。为临时解决此问题,博主建议修改Unzip源码,统一使用_ISO_INTERN()函数处理所有文件名,从而能正确识别Winzip压缩的中文文件名。但这种方法存在局限性,可能无法支持某些特殊处理的文件名。
摘要由CSDN通过智能技术生成

让Unzip正确解压其中包含中文文件名的Winzip压缩包

作者: 廖中熙(原创)

关键字: Unzip,Winzip,中文化

E-mail: lzx21cn@21cn.com

一、问题的出现:

有一天有人发了个.zip的文件给我。我unzip它,却发现中文名的文件解出来文件名是错的。

二、上网寻找问题答案:

有网友告诉我,是因为winzip用某种OEM方式修改文件名所致(后来证明这个说法是错的),

要用另外一个某某更强大的zip并关闭OEM方式再压缩才行。

但我想我们不应让别人必须用某某个软件来将就Unzip。

三、临时解决问题:*本文所提供的方法是临时性的解决办法*

1. 到底发生了什么问题?

---------------------------

实验1:在Linux下用zip压缩两个中文名文件并命名为1.zip,

结果1:在windows98下用Winzip打开中文件名没问题。

实验2: 在windows98下用Winzip压缩相同的两个中文名文件并命名为2.zip,

结果2:在Linux下用Unzip打开中文名出来的完全不对,但长度一致。

实验3: 用二进制查看器比较两个压缩文件(1.zip,2.zip),

结果3:发现两个压缩文件中的文件名二进制编码是完全一样的。

实验4: Unzip比较两个压缩文件的信息

结果4: 除文件名不同以外,就是类型(type)不同,一个是Unix,一个是fat。

结论:

winzip存文件名的方法与Unzip完全相同,

问题在Unzip中,它将类型为fat的压缩文件中的文件名作了另外的解释。

2.解决问题的方法

***************************************

*修改Unzip让它对文件名不作另外的解释。*

***************************************

找呀找......,终于找到了(我是通过学习了emacs及etags来找的)

==============================================================================

在 Unzip-5.42 源文件包中的文件 unzpriv.h 约第 2396行上下

==============================================================================

/* Convert filename (and file comment string) into "internal" charset.

* This macro assumes that Zip entry filenames are coded in OEM (IBM DOS)

* codepage when made on

* -> DOS (this includes 16-bit Windows 3.1) (FS_FAT_)

* -> OS/2 (FS_HPFS_)

* -> Win95/WinNT with Nico Mak's WinZip (FS_NTFS_ && hostver

== "5.0")

* EXCEPTIONS:

* PKZIP for Windows 2.5 and 2.6 flag their entries as "FS_FAT_", but the

* filename stored in the local header is coded in Windows ANSI (ISO

8859-1).

* Likewise, PKZIP for UNIX 2.51 flags its entries as "FS_FAT_", but the

* filenames stored in BOTH the local and the central header are coded

* in the local system's codepage (usually ANSI codings like ISO 8859-1).

*

* All other ports are assumed to code zip entry filenames in ISO 8859-1.

*/

#ifndef Ext_ASCII_TO_Native

# define Ext_ASCII_TO_Native(string, hostnum, hostver, isuxatt,

islochdr) \

if (((hostnum) == FS_FAT_ && \

!(((islochdr) || (isuxatt)) && \

(hostver) >= 25 && (hostver) <= 26)) || \

(hostnum) == FS_HPFS_ || \

((hostnum) == FS_NTFS_ && (hostver) == 50)) { \

_OEM_INTERN((string)); \

} else { \

_ISO_INTERN((string)); \

}

#endif

=============================================================================

*******************************************

*临时修正的方法:全部都用函数_ISO_INTERN()*

*******************************************

修改如下:

=============================================================================

#ifndef Ext_ASCII_TO_Native

# define Ext_ASCII_TO_Native(string, hostnum, hostver, isuxatt,

islochdr) \

/* if (((hostnum) == FS_FAT_ && \

* !(((islochdr) || (isuxatt)) && \

* (hostver) >= 25 && (hostver) <= 26)) || \

* (hostnum) == FS_HPFS_ || \

* ((hostnum) == FS_NTFS_ && (hostver) == 50)) { \

* _OEM_INTERN((string)); \

* } else { \ */

_ISO_INTERN((string)); \

/* } */

#endif

==============================================================================

编译成功,试一试,正确认出winzip压缩的中文名!!!

==============================================================================

四、方法的局限性和临时性:

***************************************************************

*方法的缺点很明显,不能正确支持那几种作了特殊处理的文件名了!!!*

*所以请高手指教更优的方法!!! *

***************************************************************

五、总结:

1.自由软件真好!

不适合我们用的,我们可以修改它。

2.从一点一滴做起。

许多软件对中文支持的不好,但是我们大家齐努力,一定能作得更好。

3.别忘了将这些简单而不起眼的工作成果,告诉其开发小组。

我想这样做,我们可以“一劳永逸”,并有时间做其它的事情。

(虽然,我也不知道应发给谁和如何发,这一次我找到了一个开发人的E-mail并发给了他,不知道有没有用)

作者: 廖中熙

E-mail:lzx21cn@21cn.com

写于:2002年11月5日

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值