python解析json数据

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。本文简要介绍Python中的相关操作,原文见Python处理Json数据

数据格式可以简单地理解为键值对的集合(A collection of name/value pairs)。不同的语言中,它被理解为对象(object),纪录(record),结构(struct),字典(dictionary),哈希表(hash table),有键列表(keyed list),或者关联数组 (associative array)。
值的有序列表(An ordered list of values)。在大部分语言中,它被理解为数组(array)。

import json

Pyhton的Json模块提供了把内存中的对象序列化的方法。

json.dumps

dump的功能就是把Python对象encode为json对象,一个编码过程。注意json模块提供了json.dumps和json.dump方法,区别是dump直接到文件,而dumps到一个字符串,这里的s可以理解为string。

data = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]
print 'DATA:', repr(data)

data_string = json.dumps(data)
print 'JSON:', data_string

DATA: [{‘a’: ‘A’, ‘c’: 3.0, ‘b’: (2, 4)}]
JSON: [{“a”: “A”, “c”: 3.0,“b”: [2, 4]}]

查看其类型,发现是string对象。

print type(data)
print type(data_string)

<type ‘list’>
<type ‘str’>

json.dump

不仅可以把Python对象编码为string,还可以写入文件。因为我们不能把Python对象直接写入文件,这样会报错TypeError: expected a string or other character buffer object,我们需要将其序列化之后才可以。

data = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]
with open('output.json','w') as fp:
    json.dump(data,fp)
cat output.json

[{"a": "A", "c": 3.0, "b": [2, 4]}]

json.loads

从Python内置对象dump为json对象我们知道如何操作了,那如何从json对象decode解码为Python可以识别的对象呢?是的用json.loads方法,当然这个是基于string的,如果是文件,我们可以用json.load方法。

decoded_json = json.loads(data_string)
# 和之前一样,还是list
print type(decoded_json)

<type 'list'>

# 像访问 data = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]一样
print decoded_json[0]['a']

A

json.load

可以直接load文件。

with open('output.json') as fp:
    print type(fp)
    loaded_json = json.load(fp)

<type 'file'>

# 和之前一样,还是list
print type(decoded_json)

<type 'list'>

# 像访问 data = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]一样
print decoded_json[0]['a']

A

数据类型对应

json和Python对象转换过程中,数据类型不完全一致,有对应。

PythonJson
dictobject
list,tuplearray
str, unicodestring
int,long,floatnumber
Truetrue
Falsefalse
Nonenull

json.dumps常用参数

一些参数,可以让我们更好地控制输出。常见的比如sort_keys,indent,separators,skipkeys等。

sort_keys名字就很清楚了,输出时字典的是按键值排序的,而不是随机的。

data = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]
print 'DATA:', repr(data)

unsorted = json.dumps(data)
print 'JSON:', json.dumps(data)
print 'SORT:', json.dumps(data, sort_keys=True)

DATA: [{‘a’: ‘A’, ‘c’: 3.0, ‘b’: (2, 4)}]
JSON: [{“a”: “A”, “c”: 3.0, “b”: [2, 4]}]
SORT: [{“a”: “A”, “b”: [2, 4], “c”: 3.0}]

indent就是更个缩进,让我们更好地看清结构

data = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]
print 'DATA:', repr(data)

print 'NORMAL:', json.dumps(data, sort_keys=True)
print 'INDENT:', json.dumps(data, sort_keys=True, indent=2)

DATA: [{‘a’: ‘A’, ‘c’: 3.0, ‘b’: (2, 4)}]
NORMAL: [{“a”: “A”, “b”: [2, 4], “c”: 3.0}]
INDENT: [
{
“a”: “A”,
“b”: [
2,
4
],
“c”: 3.0
}
]

separators是提供分隔符,可以出去白空格,输出更紧凑,数据更小。默认的分隔符是(’, ', ': '),有白空格的。不同的dumps参数,对应文件大小一目了然。

data = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]
print 'DATA:', repr(data)
print 'repr(data)             :', len(repr(data))
print 'dumps(data)            :', len(json.dumps(data))
print 'dumps(data, indent=2)  :', len(json.dumps(data, indent=2))
print 'dumps(data, separators):', len(json.dumps(data, separators=(',',':')))

DATA: [{‘a’: ‘A’, ‘c’: 3.0, ‘b’: (2, 4)}]
repr(data) : 35
dumps(data) : 35
dumps(data, indent=2) : 76
dumps(data, separators): 29

json需要字典的的键是字符串,否则会抛出ValueError。

data = [ { 'a':'A', 'b':(2, 4), 'c':3.0, ('d',):'D tuple' } ]

print 'First attempt'
try:
    print json.dumps(data)
except (TypeError, ValueError) as err:
    print 'ERROR:', err

print
print 'Second attempt'
print json.dumps(data, skipkeys=True)

First attempt
ERROR: keys must be a string

Second attempt
[{“a”: “A”, “c”: 3.0, “b”: [2, 4]}]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

auspark

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值