统计文件
# 目录内文件名称自动统计,功能要求如下:
# 能指定根目录
# 能统计根目录下文件的出现次数
# 生成excel形式的统计结果
import os
import sys
import xlwt
import random
file = xlwt.Workbook(encoding='utf-8') # 新建一个excel文件
table = file.add_sheet('sheeet 1',cell_overwrite_ok=True) # 新建一个sheet
path = sys.argv[1] # 获取程序外的第一个参数
list_dirs = os.walk(path) # 指定目录下所有子文件的根目录,子文件,文件名搜索
list_dirs = list(list_dirs) # 将元组转化为列表有利于操作
count = 0 # 该路径下所有自路径子文件的文件总数
num = dict() # 创建字典,存放每一种类型的文件,以及其个数
for i in list_dirs: # 循环,将列表中的每一个三元组也转化为列表
# 列表内部的小列表(存放根目录,路径,文件名)。转化为14×3的矩阵
list_dirs[list_dirs.index(i)] = list(i)
# 将[(2,3,4),(4,5,6),(7,8,9)]转化为[ [2,3,4],[4,5,6],[7,8,9] ]
for i in list_dirs: # 遍历整个列表(数组)
if i[1] == [] and i[2] != []: # 搜索到最底层时,中间没有文件目录了。直接是下面的独立小文件,我们按类别统计文件的个数
for j in i[2]: # i【2】是filename
# 提取filename中的后缀名,必须药加上[1],否则会报错!!1不知道为什么
name = os.path.splitext(j)[1]
if name in num: # 如果这个后缀名已经在这个存放类型的列表中,则数量加一(字典的值)
num[name] += 1
else:
num[name] = 1 # 如果这个后缀名不再列表中,其值等于1
count += 1
name = num.keys() # 调出num【】数组中不同类型的所有value值
cnt_key=-1
for i in name: # i是类型名,num[i]是类型名对应的数量
cnt_key+=1 # 写入数组table.write(行,列,value)
table.write(0, 0, '文件类型')
table.write(0,1,'文件个数')
table.write(cnt_key,0,i)
table.write(cnt_key,1,num[i])
table.write(len(name),0,"总计")
table.write(len(name),1,count)
file.save("统计文件"+str(random.randint(0,100))+".xls")
#为了防止由于一个文件名,而不能重复调用程序,所以引用了一个随机数