读取本地文件夹形成列表和类型统计

import datetime
import os
import pandas as pd
from tkinter import Tk
from tkinter.filedialog import askdirectory
from openpyxl import Workbook

# 格式化时间
time_bt = datetime.datetime.now().strftime("%Y%m%d%H%M%S%f")[:-3]

"""
本代码实现了一个简单的文件信息统计工具,用于统计指定文件夹及其子文件夹下的所有文件信息,包括文件类型和文件数量。
"""


def get_file_list(folder_path):
    """
    遍历指定文件夹及其子文件夹下的所有文件路径。

    参数:
    folder_path (str): 文件夹路径。

    返回:
    list: 包含所有文件路径的列表。
    """
    file_list = []
    for root, dirs, files in os.walk(folder_path):
        for file in files:
            file_path = os.path.join(root, file)
            file_list.append(file_path)
    return file_list


def count_file_types(file_list):
    """
    统计文件列表中各种文件类型的数量。

    参数:
    file_list (list): 包含所有文件路径的列表。

    返回:
    dict: 文件扩展名作为键,对应的文件数量作为值的字典。
    """
    file_types = {}
    for file in file_list:
        file_extension = os.path.splitext(file)[1].lower()
        if file_extension in file_types:
            file_types[file_extension] += 1
        else:
            file_types[file_extension] = 1
    return file_types


def write_to_excel(file_list, file_types, parent_directory):
    """
    将文件列表和文件类型统计结果写入Excel文件。

    参数:
    file_list (list): 包含所有文件路径的列表。
    file_types (dict): 文件扩展名作为键,对应的文件数量作为值的字典。
    """
    wb = Workbook()

    # Sheet1 - 文件列表
    sheet1 = wb.active
    sheet1.title = '文件列表'
    sheet1.cell(row=1, column=1, value="文件名称")
    for i, file in enumerate(file_list, 2):
        # 使用 os.path.basename 来获取文件名
        file_name = os.path.basename(file)
        sheet1.cell(row=i, column=1, value=file_name)

    # Sheet2 - 文件类型统计
    sheet2 = wb.create_sheet(title='文件类型统计')
    sheet2.cell(row=1, column=1, value='文件类型')
    sheet2.cell(row=1, column=2, value='数量')
    row = 2
    for file_type, count in file_types.items():
        sheet2.cell(row=row, column=1, value=file_type)
        sheet2.cell(row=row, column=2, value=count)
        row += 1

    # 保存工作簿
    wb.save(f'{parent_directory}\\file_information_{time_bt}.xlsx')


def main():
    """
    主函数,用于与用户交互选择目录,并将文件列表和文件类型统计结果写入Excel文件。
    """
    root = Tk()
    root.withdraw()  # 隐藏主窗口

    # 选择文件夹
    folder_path = askdirectory()
    # folder_path = r"D:\deepseeker_deliver"

    # 获取当前目录的上级目录
    parent_directory = os.path.dirname(folder_path)

    # 获取文件夹中所有文件的列表
    file_list = get_file_list(folder_path)
    # 统计文件类型的数量
    file_types = count_file_types(file_list)

    # 将文件列表和文件类型统计结果写入Excel
    write_to_excel(file_list, file_types, parent_directory)
    print(f'文件信息统计已完成!\n  文件统计位置:{parent_directory}\\file_information_{time_bt}.xlsx')


if __name__ == '__main__':
    main()

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值