#coding:utf-8
x = '中文' #这里的'中文'是utf-8的编码
print repr(x) #'\xe4\xb8\xad\xe6\x96\x87' #计算机里存储的是这样的,和'中文'等价
print '\xe4\xb8\xad\xe6\x96\x87' #中文
y = u'中文' #这里'中文'是unicode的编码
print repr(y) #u'\u4e2d\u6587' ,和u'中文'等价
print u'\u4e2d\u6587'.encode('utf-8') #'中文'
如果你看到有个unicode编码的字符串,如:\u9a8c\u8bc1\u7801\u4f1a\u8bdd\u65e0\u6548
则你只需要这么写
#coding:utf-8
x = u'\u9a8c\u8bc1\u7801\u4f1a\u8bdd\u65e0\u6548' #记得前面加上u,不然,默认是ascill编码,加上u表示是unicode编码
print x.encode('utf-8') #验证码会话无效