遍历文件夹中的所有文件

/// <summary>
/// 返回文件夹下的所有文件
/// </summary>
/// <param name="path">文件夹地址</param>
/// <param name="ls">用于返回的数据</param>
/// <returns></returns>
public List<string> GetFile(string path,List<string> ls) {
    DirectoryInfo theFolder = new DirectoryInfo(path);
    DirectoryInfo[] dirInfo = theFolder.GetDirectories();
    if (dirInfo.Count() == 0)
    {
        FileInfo[] files = theFolder.GetFiles();
        foreach (FileInfo NextFile in files)
            ls.Add(NextFile.Name.Substring(0, 14));
    }
    foreach (DirectoryInfo NextFolder in dirInfo)
    {
        DirectoryInfo[] childrendirInfo = NextFolder.GetDirectories();
        if (childrendirInfo.Count() == 0)
        {
            FileInfo[] fileInfo = NextFolder.GetFiles();
            foreach (FileInfo NextFile in fileInfo)  
                ls.Add(NextFile.Name.Substring(0,14));
        }
        else
            GetFile(NextFolder.FullName, ls);               
    }
    return ls;
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
使用pandas库遍历文件夹所有文件的步骤如下: 1. 导入pandas库 2. 创建一个空的DataFrame,用于存储所有读取的数据 3. 使用os.walk()函数遍历文件夹及其子文件夹 4. 对于每个文件,判断是否为Excel文件(以.xlsx为后缀) 5. 如果是Excel文件,则使用pd.read_excel()函数读取该文件的所有sheet页的数据,并将数据存储到一个DataFrame 6. 在读取每个sheet页的数据时,可以使用pd.read_excel()函数的sheet_name参数来指定读取的sheet页,也可以使用pd.read_excel()函数的sheet_name参数的默认值None来读取所有sheet页的数据 7. 在读取每个文件的数据后,可以为DataFrame新增两列,用于记录数据所属的Excel文件名和sheet页名 8. 将每个文件的数据存储到之前创建的空DataFrame,使用pd.concat()函数进行合并 9. 最终得到的DataFrame包含了所有文件夹所有Excel文件的所有sheet页的数据 代码示例: ``` import pandas as pd import os dfs = pd.DataFrame() # 创建一个空的DataFrame # 使用os.walk()函数遍历文件夹及其子文件夹 for root_dir, sub_dir, files in os.walk(r"E:\202009\源数据"): for file in files: if file.endswith(".xlsx"): # 判断是否为Excel文件 file_name = os.path.join(root_dir, file) # 构造绝对路径 for sheet in pd.read_excel(file_name, sheet_name=None).keys(): # 读取所有sheet页的数据 df = pd.read_excel(file_name, sheet_name=sheet) # 读取数据 excel_name = file.replace(".xlsx", "") # 获取Excel文件名 df["excel_name"] = excel_name # 新增一列,记录数据所属的Excel文件名 df["sheet_name"] = sheet # 新增一列,记录数据所属的sheet页名 dfs = pd.concat([dfs, df]) # 将数据存储到之前创建的空DataFrame # 最终得到的dfs包含了所有文件夹所有Excel文件的所有sheet页的数据 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值