ASCII 编码:只覆盖 A 等 127 个常用字符,一个字符用一个字节表示,其他语言不支持;
unicode 编码:支持世界上的大多数语言,不会出现乱码,一个字符用 2 个字节表示,偏僻的字符用 4 个字节表示。如果英文字符多的话会造成存储资源浪费;
utf-8 编码:把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。
内存中用 Unicode 编码,存储在硬盘上时采用 utf-8 编码方式。