关闭

iphone开发之XML parser时的编码问题

1871人阅读 评论(0) 收藏 举报

又是一个编码问题,看来编码问题,以及编码之间转换是编程中的一个大问题。就像做翻译一样,你要从不同格式编码进行“翻译”。

在解析XML文件时同样再次遇到了编码问题,iphone开发中的NSXMLParser 解析针对的是UTF-8编码,在处理英文XML网页时,没有遇到任何的问题。但当处理到中文XML时,当执行parser时遇到了问题,无法进行解析。进行一番调试之后,我们发现是由于编码方式引起的。

在英文XML网页中网页源码的开头是:

<!--?xml version="1.0" encoding="UTF-8"?-->

而中文XML网页源码开头是:

<!--?xml version="1.0" encoding="gb2312"?-->

如果我们用[[NSXMLParser alloc] initWithContentsOfURL:url]时,就会因为编码问题而无法正确解析。

那我们怎么来处理呢?想法是先用一个NSData去读取网页信息,然后使用gb2312编码将NSData数据初始化到一个NSString中,再将NSString中的"gb2312"字符串用"UTF-8"代替,再将替换过的NSString初始化赋值到一个新的NSData上,我们再使用[[NSXMLParser] initWithData:nsdata]来进行解析。

 

转换并解析的代码如下:

//urlString 是待解析的XML网页的url地址

//获取网页XML到NSData中

NSData *data = [NSData dataWithContentOfURL:[[NSURL alloc] initWithString: urlString]];

//以gb2312的编码方式将获取的NSData数据转换到string中

NSString *string = [[NSString alloc] initWithData:data encoding:0x80000632];

//替换"gb2312"为"UTF-8"

string = [string stringByReplaceingOccurrenceOfString:@"/"gb2312/"" withString:@"/"UTF-8/""];

//将转换编码并替换后的string以UTF8编码初始化到NSData中

NSData *newData = [string dataUsingEncoding:NSUTF8StringEncoding];

//初始化解析器

xmlParser = [[NSXMLParser alloc] initWithData:newData];

[xmlParser parse];

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:10297次
    • 积分:127
    • 等级:
    • 排名:千里之外
    • 原创:3篇
    • 转载:0篇
    • 译文:0篇
    • 评论:6条
    文章分类
    文章存档
    最新评论