python十行代码实现文件去重,去除重复文件的脚本(1)

本文介绍了一种使用Python实现文件去重的方法,通过遍历文件夹,对比文件的元数据和内容来判断并删除重复文件。核心代码利用了`filecmp.cmp()`函数进行文件内容的深度比较。
摘要由CSDN通过智能技术生成

‘’’

filecmp.cmp(path1, path2, shallow=True)

path1/path2:待比较的两个文件路径。

shallow :默认为True,即只比较os.stat()获取的元数据(创建时间,大小等信息)是否相同,

设置为False的话,在对比文件的时候还要比较文件内容。

‘’’

提取待去重文件路径

初始化文件路径列表

path_files_list = []

遍历

for path in Path(r’/usr/load/data’).iterdir():

校验是否为文件

if path.is_file():

加入到待去重文件列表

path_files_list.append(path)

遍历待去重文件

for file_index in range(len(path_files_list) - 1):

遍历,两辆比对

for later in range(file_index + 1, len(path_files_list)):

校验内容是否相同

if filecmp.cmp(path_files_list[file_index],

path_files_list[later], shallow=False):

内容相同、则删除

path_files_list[file_index].unlink()

b

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值