通过python脚本,可以方便地查找、并删除满足指定条件的文件/文件夹。
相关接口介绍
获取命令行参数
为了方便使用,需要把查找的目录与过滤条件通过参数的方式传递给脚本,这时就需要用到sys.argv
和getopt.getopt()
函数。
- sys.argv存放了命令行参数的列表,其中argv[0]为脚本名称;
- getopt.getopt:解析Linux样式的命令行参数;
getopt.getopt(args, shortopts, longopts=[])
- args:要解析的参数列表,一般为sys.argv[1:];
- shortopts:短选项,为单个字符(去掉
-
后的选项名),若后面紧跟冒号,表示参数选项(后面需要跟参数,可以直接跟参数或空格后跟参数),否则为开关选项;如hf:
(XX.py -h -f files
); - longopts:长选项列表,去掉
--
后的选项名;若后面紧跟等号,表示参数选项;如['path=']
(XX.py --path=c:\temp
); - 函数返回两个元素:第一个是(option,value)元组的列表;第二个是args剩余的参会列表(没有被解析的);
函数一旦遇到非选项参数(选项没有在shortopts或longopts中)时,即停止解析;把剩余的作为返回值的第二个元素。若要在混合使用选项参数与非选项参数,可使用getopt.gnu_getopt
替代。
若同一个选项参数有多个,则会返回多个元组。
文件搜索
os模块的walk与scandir可方便遍历文件:
- os.walk:遍历指定目录的文件,返回三个元素(root:当前遍历的文件夹,dirs:子文件夹列表,files:子文件列表);
- os.scandir:返回文件对象迭代器,可以通过其属性进行判断与操作(如stat,is_file);
若要进行文件名模式匹配,则需要使用glob.glob(pathname, *, recursive=False)
:
- pathname:要搜索的文件;使用*匹配零或多个字符,使用?匹配任意一个字符;
- recursive:是否递归;为true时,使用
**
匹配匹配任意层目录(tmp\**\*.txt
;则搜索tmp目录及其所有子目录下的txt文件);
文件删除
Python中有多个函数删除文件与文件夹:
- 删除文件:os.remove,只读文件无法删除,需要先用
os.chmod(f, stat.S_IWRITE)
去掉只读属性; - 删除空文件夹:os.rmdir;
- 递归删除空文件夹:os.removedirs,必须保证不包含子文件;
若要递归删除非空文件夹,需要使用shutil模块(包含文件复制、移动、删除等操作)。shutil.rmtree(path, ignore_errors=False, onerror=None)
若要删除包含只读文件文件夹,可以提供onerror(unction, path, excinfo)
回调函数,在删除失败时,去掉只读属性。
示例
以下是一个删除文件/文件夹的完成程序,一次可以传递多个过滤条件,如:rmDirs -p c:\test -f *.log -f debug
import os,sys,getopt
import stat,glob,shutil
def readonlyHandle(func, fPath, execInfo):
os.chmod(fPath, stat.S_IWRITE) # read-only file
func(fPath) # the function call this
def rmDirRecurse(fPath, fFilter):
fRoot = os.path.join(fPath, '**', fFilter)
print('To find:', fRoot)
files = glob.glob(fRoot, recursive=True)
if not files:
print('No file found')
return
for f in files:
if os.path.isdir(f):
print('to del-dir:', f)
shutil.rmtree(f, onerror=readonlyHandle)
else:
print('to del-file', f)
os.chmod(f, stat.S_IWRITE) # ensure we can del readonly-file
os.remove(f)
if __name__ == '__main__':
try:
opts, args = getopt.getopt(sys.argv[1:], 'hp:f:', ['path=', 'filter='])
except getopt.GetoptError:
print('rmDirs -p <Path to find> -f <filter>')
sys.exit(2)
fPath = None
fFilter = []
for op, v in opts:
if op in ('-p', '--path'):
fPath = v
if op in ('-f', 'filter'):
fFilter.append(v) # multi filter
if not fPath or not fFilter:
print('rmDirs -p <Path to find> -f <filter>')
sys.exit(2)
for f in fFilter:
rmDirRecurse(fPath, f)