python JSON Lines (JSONL)的保存和读取；jsonl的数据保存和读取，大模型prompt文件保存常用格式

医学小达人

已于 2024-07-10 12:10:02 修改

阅读量2k

点赞数 3

分类专栏：常用算法 NLP 文章标签： prompt JSON Lines JSONL jsonl jsonl文件保存读取

于 2024-07-10 12:08:09 首次发布

本文链接：https://blog.csdn.net/L_goodboy/article/details/140320352

版权

NLP 同时被 2 个专栏收录

64 篇文章

订阅专栏

常用算法

14 篇文章

订阅专栏

1. JSON Lines (JSONL)文件保存

将一个包含多个字典的列表保存为 JSON Lines (JSONL) 格式的文件，每个字典对应一个 JSONL 文件中的一行。以下是如何实现这一操作的 Python 代码

import json

# 定义包含字典的列表
data = [
    {"id": 1, "name": "Alice", "age": 30, "email": "alice@example.com"},
    {"id": 2, "name": "Bob", "age": 25, "email": "bob@example.com"},
    {"id": 3, "name": "Charlie", "age": 35, "email": "charlie@example.com"}
]

# 指定要保存的 JSON Lines 文件路径
file_path = 'data.jsonl'

# 将数据写入 JSON Lines 文件
with open(file_path, 'w', encoding='utf-8') as file:
    for entry in data:
        # 使用 json.dumps() 将字典转换为 JSON 格式的字符串
        json.dump(entry, file)
        # 写入换行符，以便每个字典占据文件中的一行
        file.write('\n')

print(f"已将数据写入到 {file_path} 文件中。")

2. JSON Lines (JSONL)文件读取

读取 JSON Lines (JSONL) 格式的文件并将其解析成 Python 字典列表的操作可以使用以下 Python 代码来实现

import json

# JSON Lines 文件路径
file_path = 'data.jsonl'

# 用于存储解析后的字典列表
data = []

# 读取 JSON Lines 文件
with open(file_path, 'r', encoding='utf-8') as file:
    for line in file:
        # 使用 json.loads() 将 JSON 格式的字符串解析为字典
        entry = json.loads(line)
        # 将解析后的字典添加到列表中
        data.append(entry)

# 打印读取的数据
print("从 JSON Lines 文件中读取的数据：")
for entry in data:
    print(entry)