str是字节串,由unicode经过编码(encode)后的字节组成的
unicode才是真正意义上的字符串,由字符组成
unicode->encode->str
str->decode->unicode
默认读取的时候是str,这也是在pandas读取csv时指定encoding的原因
type('中文'.decode('utf-8'))---->unicode
type(u’中文‘).encode('utf-8')---->str
改善Python代码的91条建议建议统一使用unicode,需要时再encode