中文编码问题2

中文编码显示为/u899/u4e91…

解决方法:
(其中data是乱码的数据)
import json
json.dumps(data).decode(‘unicode-escape’)

一时还没有仔细研究原理。
但是有效。
附上图片。
在这里插入图片描述
这里是大数据分析课程的一个案例,可以看到输出结果中有的部分中文是出现了乱码的,而其中两行是能够显示中文的,倒数第二行是编码成gbk的打印结果。最后能够看到的中文就是通过上面的方法解决的。

还有一个问题就是无法在Linux的python脚本中加入中文注释。这里提供一个方法,在开头第一句加入

# coding=utf8

上面的编码问题有空的时候再研究具体是怎么回事了。
最后感谢林国凤老师找到的解决方法。(不知道有一天她会不会看到这个哈哈哈)

················································································································································································································································································································································
好了,时隔9月,我胡汉三又回来了!看看之前的问题

先说为什么之前这么做的原因:
因为这里之前打印的数据其实是JSON格式的(虽然是放在列表里,但他不是字符串,而是JSON的格式),所以可以用JSON库将其转成普通字符串的格式。

然后decode呢就是解码了,因为这里之前的JSON编码呢是Unicode的,也就是看到的这种乱码的格式(JSON格式的数据很多都是这种编码的),所以需要用对应的Unicode-escape对其进行解码。

就是这样简单,当然我想应该也可以这么做

a = "此处代表上述乱码字符"
b = str(a).decode("unicode-escape")
print(b)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值