![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
字符集与编码
文章平均质量分 80
六吨代码
这个作者很懒,什么都没留下…
展开
-
字符集与编码系列:Unicode字符集与Java char类型
前文介绍了Unicode基本知识,没看过的去看一下,传送门:字符集与编码系列:Unicode字符集_liudun_cool的博客-CSDN博客常用汉字在Java中的用法对于一些常用汉字,一般都在Unicode的BMP平面,也就是2个字节足够表示。比如,我打开一个Unicode CJK码表,可以看到第一个汉字就是编码为4E00的 ‘一’,第二个是编码为4E01的 ‘丁’。下图中的CJKV的含义: C = 中国(大陆、香港、台湾) J = 日本 K ...原创 2021-10-13 15:54:45 · 547 阅读 · 0 评论 -
字符集与编码系列:Unicode字符集
基本概念1.字符集:要想在计算机中显示文字,必须把文字都收集起来放在一个表中,这个表叫字符集(Charset)。2.码表:字符集中的每个文字,都分配一个数字码,这叫码表(Code chart)。比如中文 ‘霸’字,在码表中对应的码是38712(十进制),或者9738(十六进制)。3.编码方式:有了码表,就需要确定哪些文字用几个字节表示,以及如果有多个字节代表一个字,字节的读取顺序,这些就是字符编码方式(Encoding)。虽然为了严谨起见,上面我把字符集和码表分开说明,但实际上很多字符集也给原创 2021-10-13 14:53:44 · 6375 阅读 · 0 评论