第四章 格式化输出与字符编码
字符编码
字符编码:计算机显示出来的所有文字,在底层都有一个用来翻译的字典(字符集/字符编码),如果你要显示的字,字典里没有.输出的就会变成乱码,在编程语言诞生之后,推行出了第一套字符编码,叫ascii,里面收录了英文字母,数字,特殊符号 --> 没有中文,日文等别的语言。
1995年 --> 国内推行出了GBK编码 --> 2万个汉字
中国台湾 --> BIG5码 --> 大五码,繁体字
目前世界上最主流的字符编码 --> utf-8(万国码),世界上有个组织,专门做一些统一世界知识的一些操作.这个组织收集了很多国家的语言文字,弄在一起,做成了utf-8编码。
就像一个字典,里面能翻译识别大部分国家的语言
1.目前世界上最主流的字符编码是utf-8
2.一个程序,它是用什么编码写的,你就用什么编码去使用/读取它 --> 解铃还需系铃人
转码 --> 把数据转换成别的字符编码或者别的格式
1.encode()方法是编码方式,是将需要传输的数据或者保存的数据并以什么编码方式保存。操作方式:
操作数据.encode(字符编码)
name = '小红'
print(name)
print(