Unicode的基本知识总结
前言
秋招面试某公司的时候,面试官突然发难,问起了Unicode的相关知识,使我手足无措,今天抽出时间来专门学习整理一下相关知识
一、Unicode是什么?
Unicode,中文又称万国码、国际码、统一码、单一码,是计算机科学领域里的一项业界标准。它对世界上大部分的文字系统进行了整理、编码,使得电脑可以用更为简单的方式来呈现和处理文字。
二、Unicode的编码与实现
1.Unicode的编码方式
Unicode使用16位的编码空间来构成基本多文种平面,基本上可以满足各种语言的使用。另有辅助平面,辅助平面字符占据4字节编码空间(这应该是考虑到2的31次方足以表示世界上的所有字符)
2.Unicode的实现方式
不同于编码方式,一个字符的Unicode编码是确定的,但是实现方式确多种多样(一个比较重要的考虑就是节省空间)。
Unicode的实现方式称为Unicode转换格式(Unicode Transformation Format,简称为UTF)。
转换格式有很多种,比较常用的两种是UTF-8和UTF-16