文件差异对比
difflib为python的标准库模块,无需安装。用于对比文本之间的差异。并且支持输出可读性比较强
的HTML文档,类似Linux系统的diff 命令。
应用场景: 代码和配置文件差异对比
- difflib中的Diff类实现两个字符串的差异对比,最终以版本控制的风格进行输出。
示例:
import difflib
def diff(filename1,filename2):
with open(filename1) as f:
text1=f.readlines()
with open(filename2) as f:
text2=f.readlines()
d=difflib.Differ()
#比较两个文件
diff=d.compare(text1,text2)
#以版本控制的风格返回两个文件的不同点
return "\n".join(diff)
if _ _name_ _=='_ _main_ _':
filename1= 'input/nginx_20200607_backup.conf'
filename2= 'input/nginx_20200608_backup.conf'
result=diff(filename1,filename2)
print(result)
这种方法生成的结果不直观
- difflib中的 HtmlDiff类的make_file方法可以生成美观的HTML文档
import difflib
def diff(filename1,filename2):
"""对比两个文件内容的不同并以html的格式返回"""
with open(filename1) as f:
content1=f.readlines()
with open(filename2) as f:
content2=f.readlines()
df=difflib.HtmlDiff()
return df.make_file(content1,content2)
if _ _name_ _=='_ _main_ _': #判断是否自己执行
f1='doc/password'
f2='doc/password.bak'
res=diff(f1,f2) #比较文件f1和f2的不同
print(res)
将运行结果保存到一个HTML文件中
将HTML文件使用浏览器打开
文件一致性检查
需求:当需要进行代码审计或者校验备份结果时,往往需要检查原始与目标文件的一致性
hashlib摘要算法(哈希算法)参考:https://www.liaoxuefeng.com/wiki/1016959663602400/1017686752491744
import hashlib
def generate_md5(content):
# md5=hashlib.md5()
# md5.update(content) #方式一
md5=hashlib.md5(content.encode('utf-8')) #方式二
return md5.hexdigest()
if __name__=='__main__':
fn1='doc/password'
fn2='doc/password.bak'
with open(fn1) as f:
content1=f.read()
with open(fn2) as f:
content2=f.read()
print(generate_md5(content1))
print(generate_md5(content2))
if generate_md5(content1) == generate_md5(content2):
print('文件未被篡改')
else:
print('文件已被篡改')