【Python】对比嵌套JSON的不同

原创已于 2024-01-12 10:34:59 修改 · 840 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#python #json

于 2024-01-09 17:36:20 首次发布

Python 专栏收录该内容

7 篇文章

订阅专栏

该篇文章详细描述了一个Python函数，用于对比两个JSON对象，检查其结构一致性，包括处理嵌套键值对和识别多余或缺失的字段。

前言

此对比默认json arry中的顺序相同，在Python中即list中出现的顺序相同。将结果保存在对应的xx_ret中。

import json
import os
import string

# 保存不同的字段
different_ret = []
# 保存缺失的字段
lack_ret = []
# 保存额外的字段
extra_ret = []

# 保存do_check对比时baseJson的前缀
base_json_pre_list = []

# 保存遍历多余字段的前缀
extra_pre_list = []

def do_check(jsonBase,json2):

    # 保证它们是同一种类型
    if isinstance(json2,dict):
        # 格式判断
        if not isinstance(jsonBase, dict):
            different_ret.append("格式错误")
            return

        for key_c,value_c in json2.items():

            if key_c == "conf" or key_c == "score":
                continue

            base_json_pre_list.append('['+"\""+key_c+"\""+']')
            # TODO: 更复杂的嵌套情况没有仔细想，但是应该不影响
            if key_c in jsonBase:

                tmp_aispeech_json = jsonBase[key_c]
                jsonBase["OC_" + key_c] = jsonBase.pop(key_c)

                # 判断value是否需要继续递归
                if isinstance(value_c, list) or isinstance(value_c, dict):

                    do_check(tmp_aispeech_json, value_c)
                    jsonBase["OC_" + key_c] = tmp_aispeech_json
                    continue

                # 无需继续递归，直接对比
                # 对比value
                if value_c != jsonBase["OC_" + key_c]:
                    # TODO: 收集不同的
                    different_ret.append(''.join(base_json_pre_list))

            else:
                # TODO: 收集缺少的
                lack_ret.append(''.join(base_json_pre_list))
                continue

            base_json_pre_list.pop()

    elif isinstance(json2,list):
        if not isinstance(jsonBase,list):
            different_ret.append("格式错误")
            return
        for item_c_i in range(len(json2)):
            if item_c_i >= len(jsonBase):
                lack_ret.append('['+str(item_c_i)+']')
                return
            base_json_pre_list.append('['+str(item_c_i)+']')
            do_check(jsonBase[item_c_i],json2[item_c_i])
            base_json_pre_list.pop()


# 检查额外的字段
def do_check_extra(json_object):
    if isinstance(json_object,dict):
        for key,value in json_object.items():
            extra_pre_list.append('['+"\""+key+"\""+']')
            if not isinstance(value,list) and not isinstance(value,dict): # v为string
                # 判断key是否被标记过，没有则保存
                if not "OC_" in key:
                    tmp_save_str = ''.join(extra_pre_list)
                    tmp_save_str = tmp_save_str.replace("OC_","")
                    extra_ret.append(tmp_save_str)
            else:
                do_check_extra(value)
            extra_pre_list.pop()

    elif isinstance(json_object,list):
        for item_i in range(len(json_object)):
            # 为了保存前缀，这里需要记录索引
            extra_pre_list.append('['+str(item_i)+']')
            do_check_extra(json_object[item_i])
            extra_pre_list.pop()