【python办公自动化】指定路径下重复内容文件的删除(文件唯一性检验)


手动反爬虫: 原博地址

 知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息

1. 背景需求

有时使用相机把拍摄的照片上传到电脑里,但是会由于相片的数量很多,导致之前上传的照片可能多次上传了,而现在的每张照片的内存都很大,因此就有了一个需要:把指定路径下(比如上传照片的根文件夹里)所有的照片进行重复内容的删除,只保留一张有效的照片。
在这里插入图片描述
比如上面的三张图片实际上是同一张照片,但是文件名称和文件的格式是不同的,最后处理的结果要求是只保留一张图片即可。同样的场景需求也适用在重复文件(比如word、excel、pdf、txt等)中

2. hash函数

hash()函数是python内置的函数,用于获取取一个对象(字符串或者数值 等)的哈希值。这里可以使用此方法进行文件的唯一性检验

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lys_828

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值