编码说明:
gbk:两个字节中文,一个字节英文,中文标准
utf-8(可变长,全称Unicode Transformation Format):英1bytes,中3
unicode(定长):万国符,统一双字节。全英文会多占一倍内存。
ASCII:英文考虑的编码,一个Bytes代表一个字符
what is said above:内存常用Unicode,牺牲内存,避免乱码,兼容。传输硬盘:utf-8,传输更有效率。
乱码原因:
-保存时,编码格式不对,打开就会乱码
-读取时,选错编码方式,乱码,改正解码方式解决
python处理编码
#coding:gbk
#coding=utf-8
python中,第一行代码或者第二行,会被编译器先识别,确定编码方式
python2默认ASC||,python3默认utf-8