1、字符编码和转码
1.1.在python2默认编码是ASCII, python3里默认是unicode
1.2.unicode 分为 utf-32(占4个字节),utf-16(占两个字节),utf-8(占1-4个字节), so utf-16就是现在最常用的unicode版本, 不过在文件里存的还是utf-8,因为utf8省空间
1.3.在py3中encode,在转码的同时还会把string 变成bytes类型,decode在解码的同时还会把bytes变回string
importsysprint(sys.getdefaultencoding())#打印编码格式
msg= '我是一个BOY'msg_gb2312= msg.encode("gb2312")print(msg_gb2312)
gb2312_to_unicode= msg_gb2312.decode('gb2312')print(gb2312_to_unicode)
gb2312_to_utf8= msg_gb2312.decode('gb2312').encode('utf-8')print(gb2312_to_utf8)
View Code
2、文件操作流程:
打开文件,得到文件句柄并赋值给一个变量
通过句柄对文件进行操作
关闭文件