为什么Char可以表示utf-8编码的三个字节的汉字呢？

最新推荐文章于 2023-05-02 11:11:39 发布

爱笑的小土狗

最新推荐文章于 2023-05-02 11:11:39 发布

阅读量867

点赞数 2

文章标签： java idea

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_53423030/article/details/125503899

版权

好像目前csdn上没有具体讲清这个问题，我通过多篇文章加上了一系列的思考想发表一些薄见，还请各位大牛多多指正。

首先，我举一个例子，如果用二进制表示1万，那么光用1万和用5000+4000+1000哪个用的二进制位数更少呢？显而易见的是光用1w表示的二进制数更长。

其次我要拉出一个概念，字符集和字符编码完全是两个概念。以Unicode为例，这是一种规范的字符集；Unicode用两个字节表示了世上几乎所有文字和符号，相当于所有文字和符号都对应着具体的数字，而我们常用的UTF-8只是一种编码格式，它用三个字节表示一个汉字就类似于我们上面举的例子用光1w去表示1w；而Unicode就像是用4000+1000+5000表示1w；

最后说正题，在java声明中

Char c = '中';

编译后生成的class文件会生成Unicode格式，Java char在内存中只会使用Unicode编码，所有其他编码只可能是在转换成byte[]之后才能具体体现。

爱笑的小土狗

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
为什么Char可以表示utf-8编码的三个字节的汉字呢？

从I/O流中引发的思考
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。