字符集和字符编码
字符集(CCS: Coded Character Set):
就是一个表格,表示每个字符对应数字(通常用16进制表示),比如unicode字符集中,数字1对应的就是U+00031
,字母a对应的就是U+00061
。
字符编码(CEF:Character Encoding Form):
因为计算机只认识0
和1
,所以计算机在存储字母a
(U+00031
)的时候,不能直接存储。所以就需要编码将字母a
转换成01
表示形式。对于unicode
字符,utf8
就是它的编码方案(如何utf8
转换成01
表示下文介绍)。
字符:
字符简单