1-4读取指定文件夹里的text文件名及内容

这段代码展示了如何遍历指定文件夹中的.txt文件,提取古诗题目和内容,然后按照指定格式存储到outputgus4444.jsonl中,用于进一步的数据处理或分析。
摘要由CSDN通过智能技术生成

散落的文件组成一个数据集,需要按照指定规则存储成一个文件,并存储,代码如下:

import os import jsonlines def find_txt_files(path): txt_files = [] for root, dirs, files in os.walk(path): for file in files: if file.endswith('.txt'): txt_files.append(os.path.join(root, file)) return txt_files path = 'D:\\OpenAI\\yolov5\\datasets\\\coco128\\labels' # 请替换为实际文件夹路径 txt_files = find_txt_files(path) x=[] for i in txt_files: with open(i, 'r', encoding='utf-8') as file: value={} value['instruction'] = '请根据古诗题目,回复古诗内容,要求对仗工整押韵' value['input'] = i.split('\\')[-1].split('.')[0] value['output'] = file.read().replace('\n', '') x.append(value) with jsonlines.open('outputgus4444.jsonl','w')as file1: file1.write_all(x) # print(txt_files)

import os
import jsonlines
def find_txt_files(path):
    txt_files = []
    for root, dirs, files in os.walk(path):
        for file in files:
            if file.endswith('.txt'):
                txt_files.append(os.path.join(root, file))
    return txt_files

path = 'D:\\OpenAI\\yolov5\\datasets\\\coco128\\labels'  # 请替换为实际文件夹路径
txt_files = find_txt_files(path)
x=[]
for i in txt_files:
    with open(i, 'r', encoding='utf-8') as file:
        value={}
        value['instruction'] = '请根据古诗题目,回复古诗内容,要求对仗工整押韵'
        value['input'] = i.split('\\')[-1].split('.')[0]
        value['output'] = file.read().replace('\n', '')
        x.append(value)
with jsonlines.open('outputgus4444.jsonl','w')as file1:
    file1.write_all(x)


# print(txt_files)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值