python[数据处理]把txt/excel的文件夹名对应的内容复制到一个新的文件夹

问题描述

整理数据集,一个大的文件夹A下面有1-100个子文件夹,每个子文件夹里面的图片都属于同一类,另外有一个或多个excel表或者txt文件(每个excel或者txt代表一类)分别注明这类样本对应的文件夹名。目的是把所有同一个类别的图片放到同一个文件夹内。写了一个以下的脚本来实现。

实现代码

import os
import shutil

with open('./A类.txt', 'r') as f:
    dic_name_list = f.read().splitlines
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
可以使用Python的pandas和os库来实现这个功能。 首先,我们需要读取excel文件并将其转换为pandas的DataFrame对象。假设我们要处理的excel文件为“data.xlsx”,它的第一个sheet包含以下内容: | Name | Gender | Age | |-------|--------|-----| | Alice | Female | 25 | | Bob | Male | 30 | | Carol | Female | 28 | | Dave | Male | 35 | 以下是读取excel并转换为DataFrame对象的代码: ```python import pandas as pd df = pd.read_excel('data.xlsx', sheet_name='Sheet1') ``` 接下来,我们需要按照“Gender”字段的内容来分类数据并将其保存到不同的文件夹。我们可以使用pandas的groupby方法来实现这个功能。以下是完整的代码: ```python import pandas as pd import os # 读取excel文件并转换为DataFrame对象 df = pd.read_excel('data.xlsx', sheet_name='Sheet1') # 按照“Gender”字段分类数据 groups = df.groupby('Gender') # 创建存储文件夹 for name, group in groups: if not os.path.exists(name): os.makedirs(name) # 将数据保存到对应文件夹 for name, group in groups: for index, row in group.iterrows(): file_path = os.path.join(name, f"{row['Name']}.xlsx") row.to_excel(file_path, index=False) ``` 上述代码,我们首先使用groupby方法按照“Gender”字段来分类数据。然后,我们遍历每个分类,如果对应文件夹不存在,则创建它。最后,我们遍历每个分类的每一行数据,将其保存到对应文件夹。注意,在保存数据时,我们使用了pandas的to_excel方法来将DataFrame对象保存为excel文件。 最终,我们会得到两个文件夹一个为“Female”,另一个为“Male”。在每个文件夹,我们会得到两个excel文件,分别为该文件夹对应的人员信息。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值