import datetime
import os
import pandas as pd
from tkinter import Tk
from tkinter.filedialog import askdirectory
from openpyxl import Workbook
# 格式化时间
time_bt = datetime.datetime.now().strftime("%Y%m%d%H%M%S%f")[:-3]
"""
本代码实现了一个简单的文件信息统计工具,用于统计指定文件夹及其子文件夹下的所有文件信息,包括文件类型和文件数量。
"""
def get_file_list(folder_path):
"""
遍历指定文件夹及其子文件夹下的所有文件路径。
参数:
folder_path (str): 文件夹路径。
返回:
list: 包含所有文件路径的列表。
"""
file_list = []
for root, dirs, files in os.walk(folder_path):
for file in files:
file_path = os.path.join(root, file)
file_list.append(file_path)
return file_list
def count_file_types(file_list):
"""
统计文件列表中各种文件类型的数量。
参数:
file_list (list): 包含所有文件路径的列表。
返回:
dict: 文件扩展名作为键,对应的文件数量作为值的字典。
"""
file_types = {}
for file in file_list:
file_extension = os.path.splitext(file)[1].lower()
if file_extension in file_types:
file_types[file_extension] += 1
else:
file_types[file_extension] = 1
return file_types
def write_to_excel(file_list, file_types, parent_directory):
"""
将文件列表和文件类型统计结果写入Excel文件。
参数:
file_list (list): 包含所有文件路径的列表。
file_types (dict): 文件扩展名作为键,对应的文件数量作为值的字典。
"""
wb = Workbook()
# Sheet1 - 文件列表
sheet1 = wb.active
sheet1.title = '文件列表'
sheet1.cell(row=1, column=1, value="文件名称")
for i, file in enumerate(file_list, 2):
# 使用 os.path.basename 来获取文件名
file_name = os.path.basename(file)
sheet1.cell(row=i, column=1, value=file_name)
# Sheet2 - 文件类型统计
sheet2 = wb.create_sheet(title='文件类型统计')
sheet2.cell(row=1, column=1, value='文件类型')
sheet2.cell(row=1, column=2, value='数量')
row = 2
for file_type, count in file_types.items():
sheet2.cell(row=row, column=1, value=file_type)
sheet2.cell(row=row, column=2, value=count)
row += 1
# 保存工作簿
wb.save(f'{parent_directory}\\file_information_{time_bt}.xlsx')
def main():
"""
主函数,用于与用户交互选择目录,并将文件列表和文件类型统计结果写入Excel文件。
"""
root = Tk()
root.withdraw() # 隐藏主窗口
# 选择文件夹
folder_path = askdirectory()
# folder_path = r"D:\deepseeker_deliver"
# 获取当前目录的上级目录
parent_directory = os.path.dirname(folder_path)
# 获取文件夹中所有文件的列表
file_list = get_file_list(folder_path)
# 统计文件类型的数量
file_types = count_file_types(file_list)
# 将文件列表和文件类型统计结果写入Excel
write_to_excel(file_list, file_types, parent_directory)
print(f'文件信息统计已完成!\n 文件统计位置:{parent_directory}\\file_information_{time_bt}.xlsx')
if __name__ == '__main__':
main()
读取本地文件夹形成列表和类型统计
最新推荐文章于 2024-09-11 11:22:05 发布