精品教程，用Pandas解析json格式的数据，建议收藏

最新推荐文章于 2024-08-08 22:31:00 发布

欣一2002

最新推荐文章于 2024-08-08 22:31:00 发布

阅读量3.9k

点赞数 6

文章标签：列表 python java 大数据编程语言

本文链接：https://blog.csdn.net/weixin_43373042/article/details/120376045

版权

本文介绍如何利用Pandas的json_normalize()方法解析json格式数据，包括基本json、多层嵌套数据、嵌套列表及添加前缀，提供实例展示操作过程。

摘要由CSDN通过智能技术生成

在实际工作中，尤其是网页端数据的传输，我们经常会遇到json数据，看上去和Python当中的字典类型的数据很像，本文呢小编就通过pandas当中的内置方法json_normalize()来处理json格式的数据，最终生成DataFrame数据集方便我们进行后续的操作。本文主要想通过json_normalize()这个方法解析复杂格式的json形式的数据

在开始之前，我们先导入相应的依赖库，

import pandas as pd

解析基本的json格式的数据

我们先来看一个简单的例子

a_dict = {
    '学校': '北京大学',
    '地理位置': '北京',
    '排名': 2
}

代码如下

pd.json_normalize(a_dict)

输出的结果如下

下面我们来看一个稍微有点复杂的例子，在列表中带有多个json格式的数据

json_list = [
    {'学校': '清华大学', '地理位置': '北京', '排名': 1},
    {'学校': '北京大学', '地理位置': '北京', '排名': 2},
]
pd.json_normalize(json_list)

输出的结果为

解析带有多层数据的json数据

下面我们来看一个带有多层json格式数据的对象，在“联系方式”这一层中还有“邮件”和“电话号码”，在“信息”这一层中有“学生”和“联系方式”两层，层层相套

json_obj = {
    '学校': '清华大学',
    '地理位置': '北京',
    '排名': 1,
    '信息': {
        '学生': '张三',
        '联系方式': {
            '邮件': {
                'qq邮箱': 'zhangsan@qq.com',
                '163邮箱': 'zhangsan@.com'
            },
            '电话号码': '123456789',