Unicode中英文都占两个字节(兼容GBK,注:转码后能显示,GB2312)
ASCII 只能存英文和特殊字符,一个字节,占8位
utf-8为扩展的Unicode,英文依然按ASCII,中文按三个字节
不通编码的要互相转化需要Unicode来作桥梁
Unicode和utf-8是可以直接显示的
s=”你好”
s_to_gbk=s.decode(“utf-8”).encode(“gbk”)#先解码成Unicode,然后再编码成gbk,
不做decode或不传参数,系统会默认解码成系统编码
元组内显示编码格式
gbk_to_s=g.decode(“gbk”).encode(“utf-8”)