1. 按
判断两个文件是否相同需要用到filecmp
模块:
filecmp.cmp(f1, f2, shallow=True)
比较名为f1和f2的文件,如果它们似乎相等则返回True,否则返回False
如果shallow为真,那么具有相同os.stat()签名的文件将会被认为是相等的。否则,将比较文件的内容。
遍历获取所有文件的绝对路径,我们可以利用glob模块的通配符结合recursive参数即可完成,框架如下:
for file in glob.glob(path + '/**/*', recursive=True):
pass
2. 代码
from os import remove
from os.path import isfile
from glob import glob
import filecmp
dir_path = r'E:\OneDrive - office 365 students and teachers\视频教程\MATLAB&数学建模\matlab教程\视频教程\MATLAB高等数学教学视频'
exeRemove = True
exeRemove = False
file_lst = []
for i in glob(dir_path + '/**/*', recursive=True):
if isfile(i):
file_lst.append(i)
cnt = 0
for x in file_lst:
for y in file_lst:
if x == y:
continue
elif filecmp.cmp(x, y):
file_lst.remove(x)
cnt += 1
if exeRemove:
print(cnt, "removing", x)
remove(x)
else:
print(cnt, "should remove", x)
break