Unicode可以认为是字符的编号,即每个字符在Unicode表里面的序号。
utf8是一种编码方式,类似于哈夫曼编码过程,就是把常用(位置靠前)的Unicode字符用短编码表示,不常用的字符用长代码表示,从而实现更小的整个文档的文件大小。在UTF-8编码中,英文字母是一个字节,中文(非生僻字)是2~3个字节。
可以认为,utf8是对Unicode的一种压缩算法。
Unicode可以认为是字符的编号,即每个字符在Unicode表里面的序号。
utf8是一种编码方式,类似于哈夫曼编码过程,就是把常用(位置靠前)的Unicode字符用短编码表示,不常用的字符用长代码表示,从而实现更小的整个文档的文件大小。在UTF-8编码中,英文字母是一个字节,中文(非生僻字)是2~3个字节。
可以认为,utf8是对Unicode的一种压缩算法。