json.loads时限定为utf-8

最新推荐文章于 2025-03-05 14:22:55 发布

frostjsy

最新推荐文章于 2025-03-05 14:22:55 发布

阅读量1k

点赞数 4

分类专栏： python 文章标签： json

本文链接：https://blog.csdn.net/u013069552/article/details/140632121

版权

python 专栏收录该内容

39 篇文章

订阅专栏

在使用 json.loads 解析 JSON 字符串时，默认情况下是处理 UTF-8 编码的字符串。因此，只要你的 JSON 字符串是 UTF-8 编码，json.loads 就可以正常解析。如果你需要确保字符串是 UTF-8 编码，可以在解析前进行检查和转换。

示例 1：直接使用 `json.loads` 解析 UTF-8 编码的字符串

import json

# UTF-8 编码的 JSON 字符串
json_str = '{"name": "张三", "age": 30, "city": "北京"}'

# 解析 JSON 字符串
data = json.loads(json_str)

print(data)
# 输出：{'name': '张三', 'age': 30, 'city': '北京'}

示例 2：确保字符串编码为 UTF-8 后解析

如果你的字符串可能不是 UTF-8 编码，可以使用 decode 方法确保字符串被正确处理为 UTF-8 编码，然后再使用 json.loads 进行解析：

import json

# 假设读取到的是 bytes 类型的数据
json_bytes = '{"name": "张三", "age": 30, "city": "北京"}'.encode('utf-8')

# 将 bytes 数据转换为 UTF-8 编码的字符串
json_str = json_bytes.decode('utf-8')

# 解析 JSON 字符串
data = json.loads(json_str)

print(data)
# 输出：{'name': '张三', 'age': 30, 'city': '北京'}

示例 3：从文件读取并确保 UTF-8 编码

如果 JSON 数据存储在文件中，你可以在读取时指定编码为 UTF-8，然后再进行解析：

import json

# 读取 JSON 文件，并确保使用 UTF-8 编码
with open('data.json', 'r', encoding='utf-8') as file:
    json_str = file.read()

# 解析 JSON 字符串
data = json.loads(json_str)

print(data)
# 假设 data.json 的内容为：
# {"name": "张三", "age": 30, "city": "北京"}
# 输出：{'name': '张三', 'age': 30, 'city': '北京'}

示例 4：处理可能含有 BOM 的文件

有时，文件可能会包含字节顺序标记（BOM），这可能导致解析问题。在读取文件时，可以先去除 BOM：

import json

# 读取 JSON 文件，并确保使用 UTF-8 编码
with open('data_with_bom.json', 'r', encoding='utf-8-sig') as file:
    json_str = file.read()

# 解析 JSON 字符串
data = json.loads(json_str)

print(data)