python MD5 图片去重

import hashlib
import os
import time


def getmd5(filename):
    file_txt = open(filename, 'rb').read()
    myhash = hashlib.md5(file_txt)
    return myhash.hexdigest()





if __name__ == '__main__':
    path = os.getcwd()+"\image"

    all_md5 = {}
    all_size = {}
    total_file=0
    total_delete=0

    start = time.perf_counter()
    for file in os.listdir(path):
        total_file += 1
        real_path=os.path.join(path,file)
        if os.path.isfile(real_path) == True:
            size = os.stat(real_path).st_size
            name_and_md5=[real_path,'']
            if size in all_size.keys():
                new_md5 = getmd5(real_path)
                if all_size[size][1]=='':
                    all_size[size][1]=getmd5(all_size[size][0])
                if new_md5 in all_size[size]:
                    #os.remove(os.path.join(path,file))
                    print ('删除',file)
                    total_delete += 1
                else:
                    all_size[size].append(new_md5)
            else:
                all_size[size]=name_and_md5


    end = time.perf_counter()
    time_last = end - start
    print ('文件总数:', total_file)
    print ('删除个数:', total_delete)
    print ('耗时:', time_last, '秒')

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值