Unicode字符识别成中文字符,只需在字符前加上u''即可。
方法一:
下面看实例:
str='\u8d26\u6237\u5e74\u5ea6\u6536\u76ca\u76f8\u8ddd72% \u6295\u8fde\u9669\u201c\u5206\u6c34\u5cad\u201d\u4ecd\u5b58'
str_cn =u"\u8d26\u6237\u5e74\u5ea6\u6536\u76ca\u76f8\u8ddd72%\u6295\u8fde\u9669\u201c\u5206\u6c34\u5cad\u201d\u4ecd\u5b58"
print str
print str_cn
输出结果: \u8d26\u6237\u5e74\u5ea6\u6536\u76ca\u76f8\u8ddd72% \u6295\u8fde\u9669\u201c\u5206\u6c34\u5cad\u201d\u4ecd\u5b58
账户年度收益相距72% 投连险“分水岭”仍存
方法二:
paper = str[0].decode('unicode_escape')
print paper
注:尽量避免再爬虫代码中进行编解码,尽量在转存数据库时设置编码。