针对于中文字符与Unicode间的识别问题

Unicode字符识别成中文字符,只需在字符前加上u''即可。

方法一:

下面看实例:

str='\u8d26\u6237\u5e74\u5ea6\u6536\u76ca\u76f8\u8ddd72% \u6295\u8fde\u9669\u201c\u5206\u6c34\u5cad\u201d\u4ecd\u5b58'

str_cn =u"\u8d26\u6237\u5e74\u5ea6\u6536\u76ca\u76f8\u8ddd72%\u6295\u8fde\u9669\u201c\u5206\u6c34\u5cad\u201d\u4ecd\u5b58"

print str

print str_cn

输出结果: \u8d26\u6237\u5e74\u5ea6\u6536\u76ca\u76f8\u8ddd72% \u6295\u8fde\u9669\u201c\u5206\u6c34\u5cad\u201d\u4ecd\u5b58

账户年度收益相距72% 投连险“分水岭”仍存

方法二:

paper = str[0].decode('unicode_escape')
print paper

注:尽量避免再爬虫代码中进行编解码,尽量在转存数据库时设置编码。



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值