python2在编译安装时,可以通过参数 --enable-unicode=ucs2 或 --enable-unicode=ucs4分别用于指定使用2个字节、4个字节表示unicode字符;python3无法进行选择,默认使用ucs4。
ucs4的低2个字节表示的字符和ucs2相同
查看当前python中表示unicode字符时占用的空间:
import sys
print(sys.maxunicode)
# 如果值是 65535,则表示使用uns2标准,即:2个字节表示
# 如果值是 1114111,则表示使用uns4标准,即:4个字节表示