python_爬虫 08 json文件处理

什么是json:

JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式。它基于 ECMAScript (w3c制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。 易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。更多解释请见:https://baike.baidu.com/item/JSON/2462549?fr=aladdin

在线格式化网站:https://www.json.cn/ 

JSON支持数据格式:

  1. 对象(字典)。使用花括号。
  2. 数组(列表)。使用方括号。
  3. 整形、浮点型、布尔类型还有null类型。
  4. 字符串类型(字符串必须要用双引号,不能用单引号)。

多个数据之间使用逗号分开。
注意:json本质上就是一个字符串。

字典和列表转JSON:

import json

# 将 python 对象转换成 json 字符串
persons = [
    {
        "name": "xu1",
        "age": 11,
        "height": 171
    },
    {
        "name": "xu2",
        "age": 12,
        "height": 172
    },
]
persons_str = json.dumps(persons)
print(type(persons_str))  # <class 'str'>
print(persons_str)  # [{"name": "xu1", "age": 11, "height": 171}, {"name": "xu2", "age": 12, "height": 172}]

因为 json 在 dumps 的时候,只能存放 ascii 的字符,因此会将中文进行转义,这时候我们可以使用 ensure_ascii=False 关闭这个特性。
Python中。只有基本数据类型才能转换成JSON格式的字符串。也即:intfloatstrlistdicttuple

# json 无法序列化自定义对象
class Person(object):
    country="china"
a = {
    "person": Person()
}
json.dumps(a)
"""
报错:
    TypeError: Object of type Person is not JSON serializable
"""

将json数据直接dump到文件中:

json模块中除了dumps函数,还有一个dump函数,这个函数可以传入一个文件指针,直接将字符串dump到文件中。示例代码如下:

import json

persons = [
    {
        "name": "xu1_许三多",
        "age": 11,
        "height": 171
    },
    {
        "name": "xu2_许三多",
        "age": 12,
        "height": 172
    },
]
# 方法一:将字符串写入文件
# persons_str = json.dumps(persons)
# with open("persons.json", "w", encoding="utf-8") as fp:
#     fp.write(persons_str)

# 方法二:直接通过 json.dump 写入对象
with open("persons.json", "w", encoding="utf-8") as fp:
    json.dump(persons, fp, ensure_ascii=False)

将一个json字符串load成Python对象:

import json

persons_str = '[{"name": "xu1", "age": 11, "height": 171}, {"name": "xu2", "age": 12, "height": 172}]'
persons = json.loads(persons_str)
print(type(persons))
for p in persons:
    print(p)
"""
结果:
    <class 'list'>
    {'name': 'xu1', 'age': 11, 'height': 171}
    {'name': 'xu2', 'age': 12, 'height': 172}
"""

直接从文件中读取json:

with open("persons.json", "r", encoding="utf-8") as fp:
    persons = json.load(fp)
    print(type(persons))
    for p in persons:
        print(p)
"""
结果:
    <class 'list'>
    {'name': 'xu1_许三多', 'age': 11, 'height': 171}
    {'name': 'xu2_许三多', 'age': 12, 'height': 172}
"""

目录 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值