NSURLResponse的suggestedFilename中文乱码问题

原创 2012年03月22日 14:55:16

在使用NSURLConnection下载文件时,如果通过NSURLResponse 类的 suggestedFilename 方法获取文件名,

中文的文件名会遇到乱码问题,这是因为suggestedFilename解析 HTTP 首部中的 Content-Disposition 域里的 filename 部分实现的,

而很多中文网站此处都是用的GB码,如下面这个头部:


其中的ce d2 c3 c7就是中文“我们”的GBK码,但是代码中取出来却发现是乱码,如下


其实,这是因为NSURLResponse 把 Content-Disposition 中的 filename 当成 ASCII 处理了,怪不得会乱码。

可是也不能怪 NSURLResponse,毕竟服务器没有提供任何编码的信息,而 RFC 2183 中也明确说明,不应该在 filename 中使用任何 ASCII 以外的字符,用了就是后果自负了。

有篇文章也提到了这个问题,Cocoa 的 NSString 解码错误处理,但是它的解决方法并不正确,

内存中的值并不是gbk码,


经过多次尝试,终于找到正确解码的方法,

NSString *fileName,*str;

const char *byte = NULL;


fileName = [response suggestedFilename];

byte = [fileName cStringUsingEncoding:NSISOLatin1StringEncoding];

NSStringEncoding enc = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000);

str = [[NSString allocinitWithCString:byte encoding: enc]; //如是utf,此处应改为NSUTF8StringEncoding




另附

iphone中编码转换方法

我们可以使用以下方法进行编码转换
NSString* str2 = [NSString stringWithCString:str1 encoding:enc1];
再调用NSString的cStringUsingEncoding:enc2实现从enc1到enc2的转换

但是获取enc枚举值是个难题
1. NSString.h中只定义了以下编码值
enum {
    NSASCIIStringEncoding = 1,                /* 0..127 only */
    NSNEXTSTEPStringEncoding = 2,
    NSJapaneseEUCStringEncoding = 3,
    NSUTF8StringEncoding = 4,
    NSISOLatin1StringEncoding = 5,
    NSSymbolStringEncoding = 6,
    NSNonLossyASCIIStringEncoding = 7,
    NSShiftJISStringEncoding = 8,          /* kCFStringEncodingDOSJapanese */
    NSISOLatin2StringEncoding = 9,
    NSUnicodeStringEncoding = 10,
    NSWindowsCP1251StringEncoding = 11,    /* Cyrillic; same as AdobeStandardCyrillic */
    NSWindowsCP1252StringEncoding = 12,    /* WinLatin1 */
    NSWindowsCP1253StringEncoding = 13,    /* Greek */
    NSWindowsCP1254StringEncoding = 14,    /* Turkish */
    NSWindowsCP1250StringEncoding = 15,    /* WinLatin2 */
    NSISO2022JPStringEncoding = 21,        /* ISO 2022 Japanese encoding for e-mail */
    NSMacOSRomanStringEncoding = 30,

    NSUTF16StringEncoding = NSUnicodeStringEncoding,      /* An alias for NSUnicodeStringEncoding */

#if MAC_OS_X_VERSION_10_4 <= MAC_OS_X_VERSION_MAX_ALLOWED || __IPHONE_2_0 <= __IPHONE_OS_VERSION_MAX_ALLOWED
    NSUTF16BigEndianStringEncoding = 0x90000100,          /* NSUTF16StringEncoding encoding with explicit endianness specified */
    NSUTF16LittleEndianStringEncoding = 0x94000100,       /* NSUTF16StringEncoding encoding with explicit endianness specified */

    NSUTF32StringEncoding = 0x8c000100,                   
    NSUTF32BigEndianStringEncoding = 0x98000100,          /* NSUTF32StringEncoding encoding with explicit endianness specified */
    NSUTF32LittleEndianStringEncoding = 0x9c000100        /* NSUTF32StringEncoding encoding with explicit endianness specified */
#endif
};
难道iphone中中文还不支持?不会吧?

2. iphone中肯定是支持中文的,只是NSString中没有定义这个枚举值,我们可以通过两种方法获得这个枚举值
第一个方法是通过CFStringConvertEncodingToNSStringEncoding
比如:NSStringEncoding enc = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000);
NSString* str2 = [NSString stringWithCString:str1 encoding:enc];
全部的kCFStringEncoding定义参考CFStringEncodingExt.h
另外CFStringConvertIANACharSetNameToEncoding也很有用

3. 另外一种方法是通过
const NSStringEncoding *encodings = [NSString availableStringEncodings];
NSMutableString *str = [[NSMutableString alloc] init];
NSStringEncoding encoding;
while ((encoding = *encodings++) != 0)
{
         [str appendFormat: @"%@ === %in", [NSString localizedNameOfStringEncoding:encoding], encoding];
}
然后打印str数组,你就可以知道每一个encoding的枚举值为多少了,比如中文的为-2147482063


版权声明:本文为博主原创文章,未经博主允许不得转载。 举报

相关文章推荐

NSURLResponse的suggestedFilename中文乱码问题

在使用NSURLConnection下载文件时,如果通过NSURLResponse 类的 suggestedFilename 方法获取文件名, 中文的文件名会遇到乱码问题,这是因为suggest...
  • xdonx
  • xdonx
  • 2012-03-22 14:55
  • 3130

中文乱码问题

关于MYSQL数据库的中文乱码问题: MySQL中涉及的几个字符集 character-set-server/default-character-set: 服务器字符集,默认情况下...

我是如何成为一名python大咖的?

人生苦短,都说必须python,那么我分享下我是如何从小白成为Python资深开发者的吧。2014年我大学刚毕业..

SCWCD(Servlet&Jsp learning)第一问-------HttpServletRequestWrapper应用

应用一:解决tomcat下(先来个简单的)  在tomcat下,我们通常这样来解决中文乱码问题:   过滤器代码: package filter; import java.io.*; i...

JAVA的中文字符乱码问题

JAVA的中文字符乱码问题一直很让人头疼。特别是在WEB应用中。网上的分析文章和解决方案都很多,但总是针对某些特定情况的。很多次遇到乱码问题后, 经过极为辛苦的调试和搜索资料后终于解决,满以为自己已经...

JAVA的中文字符乱码问题

(本文来自http://luzefengoo.blog.163.com/blog/static/1403593882012754428536/    klss&openheart的博客) JAVA...

mysql中文乱码问题

一、问题初现(可直接跳过查看解决方法): 历史遗留:为什么说是历史问题呢,这就要从mysql的产生说起了,在此引用wiki中mysql条目: MySQL(官方发音为英语发音:/maɪ ˌɛsk...

request.getParameter中文乱码问题

虽然最后用URLDecoder.decode(ch_String)就可以解决,但下面的文字解释了一部分内在原理 转自:http://blog.csdn.net/chenmeng2192089/a...

PHP中文乱码问题

A.首先说下HTML中文乱码问题的解决方法。 比如有个index.html的页面(这里是指真正的静态页面,修改服务器的……伪静态的请看方案B) 1.在head标签里面加入这句 view plai...

Mysql中文乱码问题

原文:http://www.2cto.com/database/201108/101151.html MySQL会出现中文乱码的原因不外乎下列几点: 1.server本身设定问题,例如还停留在...

Myeclipse2016中文乱码问题

在这里先感谢网友:444916237.他的方法在最后.在Myeclipse导入一个项目,有中文乱码问题,解决方法如下
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)