python去重复记录_python删除本地夹里重复文件的方法

import os

import hashlib

import logging

import sys

def logger():

""" 获取logger"""

logger = logging.getLogger()

if not logger.handlers:

# 指定logger输出格式

formatter = logging.Formatter('%(asctime)s %(levelname)-8s: %(message)s')

# 文件日志

file_handler = logging.FileHandler("test.log")

file_handler.setFormatter(formatter) # 可以通过setFormatter指定输出格式

# 控制台日志

console_handler = logging.StreamHandler(sys.stdout)

console_handler.formatter = formatter # 也可以直接给formatter赋值

# 为logger添加的日志处理器

logger.addHandler(file_handler)

logger.addHandler(console_handler)

# 指定日志的最低输出级别,默认为WARN级别

logger.setLevel(logging.INFO)

return logger

def get_md5(filename):

m = hashlib.md5()

mfile = open(filename, "rb")

m.update(mfile.read())

mfile.close()

md5_value = m.hexdigest()

return md5_value

def get_urllist():

#替换指定的文件夹路径即可

base = ("F:pythonFile煎蛋网无聊图jpg")

list = os.listdir(base)

urlList=[] for i in list:

url = base + i

urlList.append(url)

return urlList

if __name__ == '__main__':

log = logger()

md5List =[] urlList =get_urllist()

for a in urlList:

md5 =get_md5(a)

if (md5 in md5List):

os.remove(a)

print("重复:%s"%a)

log.info("重复:%s"%a)

else:

md5List.append(md5)

# print(md5List)

print("一共%s张照片"%len(md5List))

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值