python 删除文件 通配符_python实现自动清理重复文件

前言

大家好,又到了Python办公自动化系列。

今天分享一个系统层面的自动化案例:

「给定一个文件夹,使用Python检查给定文件夹下有无文件重复,若存在重复则删除」

主要涉及的知识点有:

os模块综合应用

glob模块综合应用

利用filecmp模块比较两个文件

步骤分析

该程序实现的逻辑可以具化为:

遍历获取给定文件夹下的所有文件,然后通过嵌套循环两两比较文件是否相同,如果相同则删除后者。

实现问题的关键就变成了?

如何判断两个文件是否相同?

在这里我们可以使用filecmp模块,来看看官方的介绍文档:

filecmp.cmp(f1, f2, shallow=True)

比较名为f1和f2的文件,如果它们似乎相等则返回True,否则返回False

如果shallow为真,那么具有相同os.stat()签名的文件将会被认为是相等的。否则,将比较文件的内容。

所以可以这样使用?

1

2

3

# 假设x和y两个文件是相同的

print(filecmp.cmp(x, y))

# True

解决了这个问题,我们就可以开始写代码了!

Python实现

导入需要的库并设置目标文件夹路径

1

2

3

4

5

import os

import glob

import filecmp

dir_path= r'C:\\xxxx'

接着遍历获取所有文件的绝对路径,我们可以利用glob模块的通配符结合recursive参数即可完成,框架如下:

1

2

for file in glob.glob(path+ '/**/*', recursive=True):

pass

由于遍历获取每一个文件或者文件夹后,需要判断是否是文件,如果是文件则可能将绝对路径存放到列表中,这里需要再完成两个事情:

首先创建一个空列表,后面用list.append(i)添加文件路径

接着利用os.path.isfile(i)判断是否是文件,返回True则执行添加元素的操作

具体代码如下

1

2

3

4

5

file_lst= []

for iin glob.glob(dir_path+ '/**/*', recursive=True):

if os.path.isfile(i):

file_lst.append(i)

上一步我们获取了目标文件夹下的所有文件路径,接下来就可以嵌套遍历这个路径列表,其中filecmp.cmp进行文件判断,os.remove进行文件删除

1

2

3

4

5

for xin file_lst:

for yin file_lst:

if x != y:

if filecmp.cmp(x, y):

os.remove(y)

这里的代码已经实现了大致逻辑,但有一个细节需要考虑到:有可能循环到文件已经被前面的判断删除了,导致os.remove(file)由于文件不存在而报错

因此,可以用os.path.exists对文件存在进行判断,如下所示:

1

2

3

4

5

for xin file_lst:

for yin file_lst:

if x != yand os.path.exists(x)and os.path.exists(y):

if filecmp.cmp(x, y):

os.remove(y)

这样,一个简易的文件去重小程序就完成了,完整代码如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

import os

import glob

import filecmp

dir_path= r'C:\xxxx'

file_lst= []

for iin glob.glob(dir_path+ '/**/*', recursive=True):

if os.path.isfile(i):

file_lst.append(i)

for xin file_lst:

for yin file_lst:

if x != yand os.path.exists(x)and os.path.exists(y):

if filecmp.cmp(x, y):

os.remove(y)

写在最后

通过本文的Python自动化脚本制作过程,我们可以再次体会Python办公自动化的强大,同时本次实现的功能可以和之前自动整理文件的脚本结合使用!

以上就是python实现自动清理重复文件的详细内容,更多关于python清理重复文件的资料请关注服务器之家其它相关文章!

原文链接:https://cloud.tencent.com/developer/article/1683712

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python通配符打开文件是通过使用glob模块中的glob方法来实现的。该方法可以根据指定的通配符模式匹配文件路径,并返回匹配到的文件路径列表。通配符操作包括: - `*`:代表0个或多个字符 - `?`:代表一个字符 - `[]`:匹配指定范围内的字符,例如`[0-9]`匹配数字。 使用方法如下所示: 1. 导入glob模块:`import glob` 2. 使用glob方法进行文件匹配:`file_list = glob.glob(pattern)` - `pattern`为匹配的路径字符串,可以为绝对路径或相对路径。 - 返回的`file_list`为匹配到的文件路径列表,只包括当前目录下的文件名,不包括子文件夹里的文件。 举例来说,如果要打开所有以`.txt`结尾的文件,可以使用以下代码: ```python import glob file_list = glob.glob("*.txt") for file_path in file_list: with open(file_path, 'r') as file: # 在这里对文件进行操作 ``` 这段代码会返回所有匹配到的`.txt`文件的路径,并逐个打开文件进行操作。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [Python 通配符删除文件的实例](https://blog.csdn.net/weixin_30035343/article/details/112882938)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [python 笔记:glob (支持通配符文件操作)](https://blog.csdn.net/qq_40206371/article/details/126421544)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值