1.uft-8是unicode的一种实现形式,相较于Python2,python3字符串都默认unicode编码。
2.encode('utf-8')是将utf-8 string转为bytes(byte string),decode('utf-8')是将bytes转为utf-8 string,注意Python2有区别。
3.建议代码中的字符串统一使用utf-8格式,特别是涉及字符串比较时。
4.unicode字符串打印出来是类似 u'你好' 的形式,bytes打印出来是类似 b'\xe4\xbd\xa0\xe5\xa5\xbd\xef\xbc\x8c\xe4\xb8\x96\xe7\x95\x8c\xef\xbc\x81' 形式。