python中的decode解码和encode编码使用,
decode是解码,它是将不是unicode的格式解码(转换)成unicode格式,使用时必须知道其格式。
encode是编码,它是将unicode格式编码(转换)成非unicode格式,使用时必须是unicode格式。
语法是:
对象.decode(非unicode格式)=unicode格式
对象.encode(非unicode格式)=非unicode格式
#-*- coding:utf-8 -*-
aa = '大幅大幅'#utf-8格式
print u'utf-8格式:',aa
bb = aa.decode('utf-8')#将utf-8格式解码成unicode格式,使用时需要知道aa的编码格式。括号格式--〉unicode
# bb = aa.encode('utf-8')
print u'unicode格式:',bb
cc = bb.encode('gb2312')#将unicode格式编码成gb2312格式,使用时bb的编码格式必须是unicode格式。unicode--〉括号格式
# cc = bb.decode('utf-8')
print u'gb2312格式:',cc
dd = bb.encode('utf-8')#将unicode格式转换为utf-8格式,
print u'utf-8格式:',dd
结果:
utf-8格式: 澶у箙澶у箙
unicode格式: 大幅大幅
gb2312格式: 大幅大幅
utf-8格式: 澶у箙澶у箙
windows控制台编码格式是‘mbcs’,不是ascii,cmd命令行中要输入‘utf8’,而不能输入‘utf-8’。