python逐个读取文件并处理_python 读取文件夹下的所有文件并处理重新分类写入...

最新推荐文章于 2024-07-28 10:36:39 发布

weixin_39884373

最新推荐文章于 2024-07-28 10:36:39 发布

阅读量799

点赞数

文章标签： python逐个读取文件并处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39884373/article/details/113992734

版权

该Python脚本用于逐个读取指定文件夹内的所有文件，以UTF-8编码打开并读取内容。对每行数据进行处理，根据特定条件（如'ztb'）对数据进行筛选，并按日期重新组织写入新的文件中。如果目标目录不存在，脚本会自动创建。在读取过程中，遇到错误会捕获并打印异常。

摘要由CSDN通过智能技术生成

import os

import sys

import io

import time

# sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030') #改变标准输出的默认编码

def read():

path = r"C:\Users\mzj\Desktop\高精准"# 文件夹目录

for i in os.listdir(path):

try:

for q in os.listdir(os.path.join(path,i)):

paths=os.path.join(path,i,q)

f = open(paths, "r", encoding="UTF-8")

lines = f.readlines()

f.close()

url = os.path.basename(paths)

li = url.split('_')

temp_lines_list = [x.strip() for x in lines]

# print(temp_lines_list)

if len(temp_lines_list) < 2:

# 行数不够，不进行处理

print('行数太短了。。。。。。')

# #去掉空行

for t in temp_lines_list:

download_file_path = r'C:\Users\mzj\Desktop'

now_title = t.split("|")

while now_title:

if now_title[8] == 'ztb':

download_path = os.path.join(download_file_path, now_title[8])

if not os.path.exists(download_path):

os.mkdir(download_path)

time_path = os.path.join(download_path, str(li[0][:4] + '-' + li[0][4:6] + '-' + li[0][6:8]))

if not os.path.exists(time_path):

os.mkdir(time_path)

urls = time_path + '/' + str(

li[0] + '_' + li[1] + '_' + str(now_title[8]) + '_' + li[3] + '_' + li[4])

with open(urls, 'a', encoding='utf-8')as f:

f.write(t + '\n')

break

else:

break

except Exception as e:

# 文件读取失败

print(e)

#去掉\n

if __name__=='__main__':

read()

weixin_39884373

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。