python判断2个文件夹是否相同_Python 程序比较两文件夹差异并读取出来

本文介绍了如何使用Python编写脚本来比较两个文件夹的差异,并将只存在于其中一个文件夹的文件和目录复制到新的目标文件夹中。在处理大量数据和文件时,这种方法比使用文件夹比较工具更有效率。
摘要由CSDN通过智能技术生成

在客户那边建库,需要把几百个G几十万个文件导入到Oracle里,好不容易导完了才发现中间缺了好几大块数据,约有四分之一吧,郁闷得很。

数据是客户从第三方买的,据客户分析是拷贝过来的时候有部分数据漏掉了,但漏掉的数据又没有什么规律,加之文件夹的嵌套层数很多,查找起来很困难。

客户又从第三方那边拷了一份全的数据,现在对这个问题有两种处理方案,一种是全部重新导一遍,大约得花一周多的时间;另一种方案是把两个数据的差异找出来,把差异的部分追加进去就行了。

项目的时间比较紧张了,只能选第二种方案,可如何把差异的数据找出来呢,试了几个文件夹比较的工具,处理几百兆的数据都吃力,更不必说这么大量的数据和文件了。

后来想了想,觉得Python解决这个问题比较方便,就研究了一下Python里的文件和目录操作,很快就完成了下面的一个脚本,可以很好地解决这个问题。

下面的脚本可以在Python24里很好地运行,在其他版本里没有测试,但用的都是基本功能,应该没有什么问题。

代码里的PathA是全的数据的文件夹,PathB是不全的数据的文件夹,PathC是个新的空目录,脚本执行完后就把PathA中有且pathB中没有的文件和目录都写到PathC里了,还可以保持原来的目录结构,速度和正确性都很令人满意。

因为是急用的代码,所以写得不很简洁,也不是很规范,在此留志,一方面供自己以后参考,另一方面也提供给需要使用Python进行文件和目录操作的兄弟们共同参考。

代码如下:

# c

好的,我会帮你解压 `lab3.zip` 文件夹,并编写一个 Python 脚本来读取并对比每个文件差异,并输出差异字符。请确保你已经将 `lab3.zip` 文件夹放在当前工作目录下。 以下是示例代码: ```python import os import difflib def compare_files(file1, file2): with open(file1, 'r') as f1, open(file2, 'r') as f2: lines1 = f1.read() lines2 = f2.read() diff = difflib.ndiff(lines1, lines2) # 输出差异字符 for line in diff: if line.startswith('- ') or line.startswith('+ '): print(line[2:], end='') def compare_directory(directory): files = os.listdir(directory) file_count = len(files) # 对比文件内容 for i in range(file_count - 1): for j in range(i + 1, file_count): file1 = os.path.join(directory, files[i]) file2 = os.path.join(directory, files[j]) print(f"\nComparing {files[i]} and {files[j]}:") compare_files(file1, file2) # 解压文件夹 import zipfile with zipfile.ZipFile('lab3.zip', 'r') as zip_ref: zip_ref.extractall() # 对比文件夹中的文件内容 compare_directory('lab3') ``` 请确保你已经安装了 Python 的 `zipfile` 模块,可以通过 `pip install zipfile` 进行安装。 在上述代码中,我们首先使用 `zipfile` 模块解压了 `lab3.zip` 文件夹。然后,定义了 `compare_files` 函数来对比两个文件差异,并输出差异字符。接着,定义了 `compare_directory` 函数来遍历文件夹中的文件,并通过调用 `compare_files` 函数对比每对文件差异。最后,调用 `compare_directory` 函数来比较 `lab3` 文件夹中的所有文件。 运行以上代码后,将会逐个对比每对文件差异,并输出差异字符。你可以根据需要进行进一步处理,比如将差异字符保存到文件中。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值