通过Python 实现文件夹大小的统计:主要是通过了 import os 中的几个方法来实现。
--Zero
首先介绍用到的几个函数,写了一个小demo便于理解。
os.getcwd()
返回当前路径。
os.listdir (path)
返回当前路径下的文件夹与文件(不向下二级递归)。
os.path.join()
join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。
os.path 让join()识别为路径,根据系统自动补齐'\' '/'。
os.path.getsize(path) 返回文件大小
1 #-*- encoding: utf-8 -*_
2 importos3
4 path = os.getcwd() #获取当前路径
5 for dirs inos.listdir(path):6 printdirs7
8 file_name = "路径补齐.txt"
9 path =os.path.join(path,file_name)10 printpath11 size = os.path.getsize("E:\PythonEclipse\PythonStudy\os.listdir\listdirs.py")12 print size
输出结果:
1 A2 B3 C4 file.txt5 listdirs.py6 E:\PythonEclipse\PythonStudy\os.listdir\路径补齐.txtA
7 303
os.walk(top[, topdown=True[, οnerrοr=None[, followlinks=False]]])
top -- 根目录下的每一个文件夹(包含它自己), 产生3-元组 (dirpath, dirnames, filenames)【文件夹路径, 文件夹名字, 文件名】。
topdown --可选,为True或者没有指定, 一个目录的的3-元组将比它的任何子文件夹的3-元组先产生 (目录自上而下)。如果topdown为 False, 一个目录的3-元组将比它的任何子文件夹的3-元组后产生 (目录自下而上)。
onerror -- 可选,是一个函数; 它调用时有一个参数, 一个OSError实例。报告这错误后,继续walk,或者抛出exception终止walk。
followlinks -- 设置为 true,则通过软链接访问目录。
1 #-*- encoding: utf-8 -*_
2 importos3
4 for root, dirs, filename inos.walk(os.getcwd()):5 printroot6 printdirs7 print filename
输出结果:
1 E:\PythonEclipse\PythonStudy\os.listdir2 ['A', 'B', 'C']3 ['file.txt', 'listdirs.py']4 E:\PythonEclipse\PythonStudy\os.listdir\A5 []6 []7 E:\PythonEclipse\PythonStudy\os.listdir\B8 []9 ['file.txt']10 E:\PythonEclipse\PythonStudy\os.listdir\C11 []12 []
功能实现思路:
需要获取文件夹的大小,只要遍历文件下所有的文件,获取所有文件大小求和即可。
这里是实现的是当前目录下,文件夹大小不包括当前文件下文件大小。
python的编码的格式,需要注意。
1 #-*- encoding: utf-8 -*-
2 importos3 rootdir = os.getcwd() #获取当前路径
4
5 rootdir = rootdir.decode('gbk')6 x = u'统计文件大小.csv'
7 f = open(os.path.join(rootdir,x), "w+")8 for dirname in os.listdir(rootdir): #获取二级目录所有文件夹与文件
9 Dir = os.path.join(rootdir, dirname) #路径补齐
10 count =011 if (os.path.isdir(Dir)): #判断是否为目录
12 for r, ds, files in os.walk(Dir): #遍历目录下所有文件根,目录下的每一个文件夹(包含它自己), 产生3-元组 (dirpath, dirnames, filenames)【文件夹路径, 文件夹名字, 文件名称】
13 for file in files: #遍历所有文件
14 size = os.path.getsize(os.path.join(r, file)) #获取文件大小
15 count +=size16 if ((count/1024.0/1024.0) < 1024):17 print Dir +'\t' + '%.2f'% (count/1024.0/1024.0)+'MB'
18 f.write(Dir.encode("gbk") +','+ '%.2f'% (count/1024.0/1024.0)+'MB' + '\n')19 else:20 print Dir + '\t' + '%.2f' % (count / 1024.0 / 1024.0/1024.0) + 'GB'
21 f.write(Dir.encode("gbk") + ',' + '%.2f' % (count / 1024.0 / 1024.0/1024.0) + 'GB' + '\n')22 else:23 continue
24 f.close()