1.常见的字符编码:unicode、utf-8、gbk(windows默认编码)
2.什么是unicode:
它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。Unicode 编码共有三种具体实现,分别为utf-8,utf-16,utf-32,其中utf-8占用一到四个字节,utf-16占用二或四个字节,utf-32占用四个字节[来自百度百科]
3.decode和encode
解码:从其他编码转为unicode
编码:从unicode转为str
decode:将str类对象解码为unicode类对象[str.decode()]
encode:将unicode类对象编码为其他格式,[unicode.encode()]
str.decode()===str.decode(sys.getdefaultencoding()).encode()
sys.getdefaultencoding():默认返回python的默认编码
4.修改系统的默认编码
import sys,importlib
importlib.reload(sys)
sys.getdefaultencoding('gbk')
5.应用:subprocess操作系统调用
import subprocess
g = subprocess