字符编码
定义:人类字符转换为数字的过程称之为字符编码,参照一张表,表称为字符编码表
字符编码表分类
ASCII :用8bit对应一个英文字符
可以识别英文字符
gbk:用16bit对应字符
可以识别中文字符、英语字符
shift - JIS:
可以识别日文字符、英文字符
Ecu-KR
可以识别韩文字符,英文字符
万能字符编码:unicode,用16bit位对应一个字符
万国字符------------》unicode格式的二进制(内存)---------》utf-8格式的二进制(硬盘)
中文、英文字符------------》unicode格式的二进制(内存)---------》GBK格式的二进制(硬盘)
日文、英文字符------------》unicode格式的二进制(内存)---------》shift-JIS格式的二进制(硬盘)
utf-8全称Unicode Transformation Format,
若想保证不乱码
1、保证存不乱
存入硬盘的编码格式要能识别输入的字符
2、保证读不乱
存取硬盘用得都是同一种字符编码格式
3、往硬盘存的新文件以后都存成utf-8格式
python3 D:\全栈18期\day09\代码\test.py
python3解释器默认读文件的编码格式是utf-8
python3解释器默认读文件的编码格式是ASCII
推荐用python3解释器,因为python3解释器存字符串类型的值会存储unicode格式
如果用到python2解释器,记得在字符串类型前加前缀u