unsigned char 与 char在UTF8String 编码中的差异

Coding_Physical

于 2020-12-05 20:09:36 发布

阅读量640

点赞数

分类专栏： Flutter知识梳理个人OC知识梳理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Coding_Physical/article/details/110716697

版权

个人OC知识梳理同时被 2 个专栏收录

110 篇文章

订阅专栏

Flutter知识梳理

42 篇文章

订阅专栏

本文详细介绍了如何在Objective-C中使用NSUTF8StringEncoding进行UTF8编码与解码的过程，包括从字符串到NSData再到Byte的转换，并解释了为什么使用unsigned char而非char的原因。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Dart语言中utf8.encode(string);是将string编码成无符号bytes,那么对应在OC中将拆分成几部分

001 将字符串通过NSUTF8StringEncoding编码转化成NSData

NSString* utf8EncodingStr = [[NSString alloc]initWithData:data encoding:NSUTF8StringEncoding];

NSData *testData = [utf8EncodingStr dataUsingEncoding: NSUTF8StringEncoding];//字符串转化成 data

002 将NSData 转化成Byte

Byte*testByte = (Byte*)[testData bytes];

003 将Byte 转化成uint8_t*bytes 查看源码

uint8_t*bytes =malloc(sizeof(*bytes)*testData.length);

#ifndef _UINT8_T

#define _UINT8_T

typedef unsigned char uint8_t;

#endif /* _UINT8_T */

Dart 中UTF8解码

List<int> cipherTextList = new List<int>.from(cipherText);

var result = utf8.decode(cipherTextList);

004 UTF8解码

NSData*adata = [[NSData alloc]initWithBytes:bytes length:testData.length];

NSString *result =[[ NSString alloc] initWithData:adata encoding:NSUTF8StringEncoding];

这样做的好处就是可以将中文字符也一并处理在经过解密算法后得到的bytes 可以解析成正确的字符。

如果是将NSString中每个字符进行处理这里每个字符都是char带有符号的，那么中文编解码就会显现乱码。

底层字符原理：

在内存中char与unsigned char 都是一个字节，8比特，不同的是两者的最高位，char的范围是-128-127，unsigned char的取值范围是0-255，

在表示byte是都是用unsigned char，是因为将byte的值赋值给int long 等数据类型时，如果是char系统会进行高位扩展，而unsigned char 不会。

个人感受这是计算机基础的知识，基础不扎实，就会有技术认知偏差

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。