Python27中Json对中文的处理

最新推荐文章于 2023-02-11 22:07:24 发布

weixin_33853794

最新推荐文章于 2023-02-11 22:07:24 发布

阅读量91

点赞数

文章标签： json python

应用场景如下：从api下载数据，json解析，存入字典，定期保存。重启程序需要加载保存的文本。

问题1：json中都是unicode串，存到文本里都是些\u***

解决：关闭ensure_ascii开关

json.dump(pub.listData,fp,ensure_ascii=False)

问题2：字典关键字用的数字，从文本load后变为unicode串

解决：

走了一点弯路，网上的解决方法，都是转换，把串转回utf-8，方法是

def byteify(input):

    if isinstance(input, dict):

        return {byteify(key):byteify(value) for key,value in input.iteritems()}

    elif isinstance(input, list):

        return [byteify(element) for element in input]

    elif isinstance(input, unicode):

        return input.encode('utf-8')

    else:

        return input

但发现，json相关的都是unicode，转不胜转。

最后解决方法，还是用unicode存，但是load后，加一个处理，把key转换为数值就行

pub.listData=json.load(fp)
pub.listData={int(k):v for k,v in pub.listData.items()}

问题3：编码问题

解决：

    默认情况下，用sys.getdefaultencoding()查看是utf-8

    decode（code）：把code转换为unicode

    encode（code）：把unicode转换为code

如果对一个非unicode格式的串，调用encode的话，则会用默认编码转化为unicode，再进行encode。系统默认编码为ascii，所以常常出错

设置默认编码：

在python的Lib\site-packages文件夹下新建一个sitecustomize.py，内容为：

# encoding=utf8

import sys

reload(sys)

sys.setdefaultencoding('utf8')

问题4：读入unicode的中文的处理

比如csv文件，excel正常，python读入数据类似：

[18]:'\xc2\xf2\xd2\xbb\xc1\xbf'

直接输出为乱码，需要解码再编码：

print df.columns[0].decode("gbk").encode('utf-8')

市场代码

weixin_33853794

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python27中Json对中文的处理

应用场景如下：从api下载数据，json解析，存入字典，定期保存。重启程序需要加载保存的文本。问题1：json中都是unicode串，存到文本里都是些\u*** 解决：关闭ensure_ascii开关 json.dump(pub.listData,fp,ensure_ascii=False) 问题2：字典关键字用的数字，从文本load后变为unicode串解决：走了一点弯路，网上的解决...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。