程序文件名不能跟模块名称一致,否则会报错

AttributeError: 'module' object has no attribute

递归  计算阶层 函数自己调用自己,有限制,n=0


3.OS.path对文件路径的处理

4.python处理文件元信息(文件大小等)

OS模块的方法

通过args判断输入的是目录,不存在的路径

os.path.abspath(path) #返回绝对路径

os.path.basename(path) #返回文件名

os.path.commonprefix(list) #返回list(多个路径)中,所有path共有的最长的路径。

os.path.dirname(path) #返回文件路径

os.path.exists(path)  #路径存在则返回True,路径损坏返回False

os.path.lexists  #路径存在则返回True,路径损坏也返回True

os.path.expanduser(path)  #把path中包含的"~"和"~user"转换成用户目录

os.path.expandvars(path)  #根据环境变量的值替换path中包含的”$name”和”${name}”

os.path.getatime(path)  #返回最后一次进入此path的时间。

os.path.getmtime(path)  #返回在此path下最后一次修改的时间。

os.path.getctime(path)  #返回path的大小

os.path.getsize(path)  #返回文件大小,如果文件不存在就返回错误

os.path.isabs(path)  #判断是否为绝对路径

os.path.isfile(path)  #判断路径是否为文件

os.path.isdir(path)  #判断路径是否为目录

os.path.islink(path)  #判断路径是否为链接

os.path.ismount(path)  #判断路径是否为挂载点()

os.path.join(path1[, path2[, ...]])  #把目录和文件名合成一个路径

os.path.normcase(path)  #转换path的大小写和斜杠

os.path.normpath(path)  #规范path字符串形式

os.path.realpath(path)  #返回path的真实路径

os.path.relpath(path[, start])  #从start开始计算相对路径

os.path.samefile(path1, path2)  #判断目录或文件是否相同

os.path.sameopenfile(fp1, fp2)  #判断fp1和fp2是否指向同一文件

os.path.samestat(stat1, stat2)  #判断stat tuple stat1和stat2是否指向同一个文件

os.path.split(path)  #把路径分割成dirname和basename,返回一个元组

os.path.splitdrive(path)   #一般用在windows下,返回驱动器名和路径组成的元组

os.path.splitext(path)  #分割路径,返回路径名和文件扩展名的元组

os.path.splitunc(path)  #把路径分割为加载点与文件

os.path.walk(path, visit, arg)  #遍历path,进入每个目录都调用visit函数,visit函数必须有

3个参数(arg, dirname, names),dirname表示当前目录的目录名,names代表当前目录下的所有

文件名,args则为walk的第三个参数

os.path.supports_unicode_filenames  #设置是否支持unicode路径名


hashlib对文件做校验,md5sum

m = hashlib.md5()

m.update('a')

m.hexdigest()

echo -n a | md5sum

递归  

计算阶层 函数自己调用自己,有限制,n=0

必须有最后的默认结果

if n==0

递归参数必须向默认结果收敛

f(n-1)

一层调一层

def factorial(n):

[i for i in lsdir if isfile(join(path,i))]

函数里面一般return,不是print,一般print 函数名

python 查看帮助

import pickle  

help(pickle)


生成器

def f(n):

   for i in range(n):

   yield i#生成器

a = f(5)

生成器是一个可以迭代的对象,而已对可迭代对象进行遍历,比如字符串,列表等,是可迭代对象

a.next()依次查看生成器的值

对目录做MD5校验

find . -type f -exec md5sum {} \ | md5sum

计算整个目录大小

du   wc -c

os.path.getsize('/etc/passwd')


计算某个目录下所有文件的md5sum

计算某个目录的md5sum

计算整个目录的文件大小

找到目录中内容相同的文件

1.先定义计算文件md5值的函数

做成一个字典形式

2.key是md5值

3.value是filename

4.filename做为列表,当值大于1


按照字典值排序

按照字典value排序,类似sort -k命令

import operator

x = {1:2,3:4,4:3}

sorted_x = sorted(x.iteritems(),key=operator.itemgetter(1))

sort -k  n 以第几列排序


找出占用空间比较大的文件

os.walk

os.path.getsize

找到的结果放到字典里

dict sort


打开外部程序建议使用 subprocess模块

os.system 输出在终端上,捕获不到

os.popen  只能捕捉到标准输出,捕捉不到标准错误输出

os.popen2 返回2个对象,一个是标准输入,一个是标准输出

os.popen3 返回3个对象,标准输入,标准输出,标准错误输出

os.popen4 返回2个对象,pipe_in和pipe_out_err


import subprocess

subprocess.call('ls -l',shell = True)

subprocess.check_call('ls -l',shell = True)会抛出异常

subprocess.Popen 返回3个对象  输入,输出,错误输出

from subprocess import Popen,PIPE

p =Popen(['dmidecode'],stdout=PIPE)

p.stdout.readline()