有的二维码生成的含有中文的数据编码是GBK编码,如百度二维码生成器,使用系统原生二维码扫描就会出现乱码,于是开始网上查阅,该试的方法都尝试过了,终于功夫不负有心人,问题得到了解决,先上代码
NSString *result=self.ScanResultString;//返回的扫描结果
NSData *data=[self.ScanResultString dataUsingEncoding:NSUTF8StringEncoding];
NSStringEncoding enc = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000);
NSString *retStr = [[NSString alloc] initWithData:data encoding:enc];//如果中文是utf-8编码转gbk结果为空(还没搞明白)
if (retStr)//如果扫描中文乱码则需要处理,否则不处理
{
NSInteger max = [self.ScanResultString length];
char *nbytes = malloc(max + 1);
for (i = 0; i < max; i++)
{
unichar ch = [self.ScanResultString characterAtIndex: i];
nbytes[i] = (char) ch;
}
nbytes[max] = '\0';
result=[NSString stringWithCString: nbytes
encoding: enc];
}
这样处理后的结果就可以解决乱码问题了
问题分析:
比如使用百度二维码生成器生成一个纯文本二维码,内容是:二维码ok
不处理,扫描的结果是:¶þάÂëok,乱码。。。。
因为 NSString 本身是按照 UTF-16 编码的,所以如果逐个字符地观察这个错误解码后的 NSString:
int max = [str length];
int i;
for (i = 0; i < max; i++)
{
unichar ch = [str characterAtIndex: i];
printf(“%x “, ch);
}
我们可以得到:
b6 fe ce ac c2 eb 6f 6b
这样一串输出,6f 6b 就是 ok,比较好认,前面的b6 fe ce ac c2 eb 是什么呢?一查,原来是“二维码”这三个字的 GBK 编码。
这就好理解了:NSString 一开始把一段 GBK 编码的字节流逐个字节地按照 8bit处理了,原本 8 个字节对应的是 5 个字符,结果被错误地解码为了 8 个字符,所以我们要把它转换回去,首先是要还原回原来的那段字节流:
int max = [str length];
char *nbytes = malloc(max + 1);
int i;
for (i = 0; i < max; i++)
{
unichar ch = [str characterAtIndex: i];
nbytes = (char) ch;
}
nbytes = ‘\0’;
然后再将这段字节流按照正确的编码 (GB18030) 处理:
NSStringEncoding enc = CFStringConvertEncodingToNSStringEncoding(
kCFStringEncodingGB_18030_2000);
NSLog(@”处理后: %@”, [NSString stringWithCString: nbytes
encoding: enc]);
结果果然得到了正确的输出:
2015-07-10 10:27:25.760 test[11750:941165] 处理后:二维码ok
这样问题就解决了 ,如果有理解不当的地方请不吝指出,转载请注明文章出处