使用python编程,如果涉及到中文字符串,常常需要考虑字符串的encode和decode问题。
python里面使用u声明的字符串为unicode类型,eg:
astring = u"你好,这是个测试用例",
使用type(astring)查看,其类型为unicode(直接显示字符对象,字符编码使用\u分隔);
通过bstring = astring.encode("utf-8")可以得到astring的str类型字符串(显示字符对象,字符编码使用\x分隔);
还可以使用cstring = astring.decode("utf-8")将它再次转会到unicode类型;
unicode --encode--> string
string --uncode--> unicode
是不是和你想象中的关系有点相反?