用python实现文件比较

最新推荐文章于 2024-02-26 20:00:00 发布

pkrobbie

最新推荐文章于 2024-02-26 20:00:00 发布

阅读量2.1w

点赞数 5

分类专栏： Python 文章标签： python dictionary insert 工具 delete

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pkrobbie/article/details/1641036

版权

Python 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

越来越发现python非常适合做一些日常开发的工具。

平时，我们经常用一些比较工具，比较目录、比较两个文本文件的变化。最近发现，python的标准库里居然带了这些功能的算法。自己处理一下，就可以写出一个很实用的比较工具了。

文件和目录比较Module叫做filecmp。最酷的是他提供了一个叫 dircmp的类，可以直接比较两个目录，给出下面的结果。

left_list

Files and subdirectories in a, filtered by hide and ignore.

right_list

Files and subdirectories in b, filtered by hide and ignore.

common

Files and subdirectories in both a and b.

left_only

Files and subdirectories only in a.

right_only

Files and subdirectories only in b.

common_dirs

Subdirectories in both a and b.

common_files

Files in both a and b

common_funny

Names in both a and b, such that the type differs between the directories, or names for which os.stat() reports an error.

same_files

Files which are identical in both a and b.

diff_files

Files which are in both a and b, whose contents differ.

funny_files

Files which are in both a and b, but could not be compared.

subdirs

A dictionary mapping names in common_dirs to dircmp objects.

另外，它还提供了几个函数，可以递归比较子目录，输出一个文本报告。不过觉得这个功能用处不大，除非他的格式刚好满足要求。不过，代码倒是可以参考。

另一个重要的模块是使difflib。包括两个类 SequenceMatcher，使这个模块的基础，可以用来比较任意两个序列的变化，list/string都没问题。另外一个Differ,可以比较两个文本文件的差别，产生一个文本文件的报告。还有一个更酷的HTMLDiff, 可以直接产生HTML格式的比较报告。感觉后两个类的主要价值是提供了一个框架，我们可以做一些修改，按照自己的格式定制报告。如果对报告要求特别，可以直接使用SequenceMatcher。

贴个小例子：[这个代码是pyhton 2.x的]

def reportSingleFile(srcfile, basefile, rpt):

src = file(srcfile).read().split( ' ' )

base = file(basefile).read().split( ' ' )

import difflib

s = difflib.SequenceMatcher( lambda x: len(x.strip()) == 0, # ignore blank lines

base, src)

lstres = []

for tag, i1, i2, j1, j2 in s.get_opcodes():

print (tag, i1, i2, j1, j2)

# print lstres

if tag == ' equal ' :

pass

elif tag == ' delete ' :

lstres.append( ' DELETE (line: %d) ' % i1)

lstres += base[i1:i2]

lstres.append( ' ' )

elif tag == ' insert ' :

lstres.append( ' INSERT (line: %d) ' % j1)

lstres += src[j1:j2]

lstres.append( ' ' )

elif tag == ' replace ' :

lstres.append( ' REPLACE: ' )

lstres.append( ' Before (line: %d) ' % i1)

lstres += base[i1:i2]

lstres.append( ' After (line: %d) ' % j1)

lstres += src[j1:j2]

lstres.append( ' ' )

else :

pass

print ' ' .join(lstres)

用久了C++，算法要么自己写，要么去网上找。用Python之后，感觉真的不一样了。虽然python的运行效率不高，但是开发效率确实非常高。很适合做一些平时用的小工具。

关注

5
点赞
踩
16

收藏

觉得还不错? 一键收藏
2
评论
用python实现文件比较

越来越发现python非常适合做一些日常开发的工具。平时，我们经常用一些比较工具，比较目录、比较两个文本文件的变化。最近发现，python的标准库里居然带了这些功能的算法。自己处理一下，就可以写出一个很实用的比较工具了。文件和目录比较Module叫做filecmp。最酷的是他提供了一个叫dircmp的类，可以直接比较两个目录，给出下面的结果。left_list Files
复制链接

扫一扫

专栏目录

pkrobbie CSDN认证博客专家 CSDN认证企业博客

码龄18年

87: 原创

8万+: 周排名

1万+: 总排名

36万+: 访问

: 等级

4559: 积分

106: 粉丝

88: 获赞

57: 评论

173: 收藏

私信

关注

热门文章

分类专栏

.Net 5篇
C/C++ 23篇
Database 13篇
Healthcare 9篇
Office 2篇
Others 26篇
Python 8篇
Web 3篇
Image processing 9篇
deeplearning 1篇

最新评论

vtk表面提取参数研究
lordn_buaa: 请问PointLocator的作用是是什么呢？我加了之后模型提取的速度大幅降低，并且模型质量也没有什么提升
windows 10安装gitlab docker
weixin_42175698: 笔记：3.配置https中的ii：要设置通用的信息，您可以在命令中使用默认值或者使用相同的值来填充所有的信息。下面是一个示例命令，使用相同的值填充所有信息： shell Copy openssl req -new -key /etc/gitlab/ssl/192.168.149.129.key -out /etc/gitlab/ssl/192.168.149.129.csr -subj "/C=US/ST=State/L=City/O=Organization/OU=Company/CN=192.168.149.129/[email protected]" 上述命令中的"/C=US/ST=State/L=City/O=Organization/OU=Company/CN=192.168.149.129/[email protected]"部分是指定的主题（Subject），其中的值被设置为通用的信息。
windows 10安装gitlab docker
weixin_42175698: 笔记：3. 配置https中的 e. 复制证书到gitlab目录： cp /etc/gitlab/ssl/etc/gitlab/ssl/192.168.149.129.crt /etc/gitlab/trusted-certs/ 多复制了/etc/gitlab/ssl
windows 10安装gitlab docker
DruidTing: 寫得非常詳細!!
vtk表面提取参数研究
pkrobbie: 也许这是你想要的 https://kitware.github.io/vtk-examples/site/Cxx/Points/CompareExtractSurface/

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。