汉字的不同编码表示

最新推荐文章于 2022-12-19 19:31:21 发布

xiaobai1593

最新推荐文章于 2022-12-19 19:31:21 发布

阅读量1.2k

点赞数

文章标签： windows c

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaobai1593/article/details/7393949

版权

汉字用不同的编码方式有不同的实现，下面以ANSI、Utf-8、Utf-16为例进行表示

以汉字中的“ 汉 ”为例

(1) 在Ansi中，一个英文占用一个char，一个汉字则占用两个char（会用到负值）

调试查看，其表示为：-70 -70

对应的十六进制表示为：BA BA

与用Ultra Edit查看得到的结果相同。

Utf-8、Utf-16都是Unicode编码方式的实现

“ 汉 ”的Unicode码为：0x6c49

(2) Utf-8为Unicode的变长编码实现，即一个字符可能用1-4个字节来表示（具体查看Unicode编码方案简介及实现）

E6 B1 89

(3) Utf-16一个字符用2个字节来表示

在调试时，发现” 汉 “的表示为：27721

对应的十六进制表示为：6C49

使用代码如下：

Windows、VC++

char sBuf[10]={0};
strcpy(sBuf, "汉字");

wchar_t wBuf[10]={0};
wcscpy(wBuf, L"汉字");

然后调试、查看内存

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
汉字的不同编码表示

汉字用不同的编码方式有不同的实现，下面以ANSI、Utf-8、Utf-16为例进行表示以汉字中的“ 汉 ”为例(1) 在Ansi中，一个英文占用一个char，一个汉字则占用两个char（会用到负值）调试查看，其表示为：-70 -70对应的十六进制表示为：BA BA与用Ultra Edit查看得到的结果相同。Utf-8、Utf-16都是Unicode编码方式的实现“ 汉
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。