日常工作中,有可能需要对比两个文件的数据差异,在大量数据的情况下,常用的办法是使用数据库对比,现推荐一个使用python脚本对比数据的方法,实际测试,文件一有60万行数据,文件2有50万行数据,对比差异耗时1.5S,大大节省了对比数据的耗时,在数据库里加索引的情况下,也需要7S左右出结果,所以python是无比神奇的。
代码:
import argparse
import sys
import time
import datetime
##################wirten by diorlitao####################################
# 使用方法
#需要安装python3.6及以上版本
#1、将脚本和要对比的文本文件放到同一个目录下
#2、将两个需要对比的文本转为UTF-8格式
#3、在cmd命令行模式下执行:python diff_file.py -f1 1.txt -f2 2.txt
###################1.txt 和 2.txt是要对比的文本文件#######################
def readfile(filename):
try:
with open(filename, 'r',encoding='UTF-8') as fileHandle:
text = fileHandle.read().splitlines()
#print(text)
return text
except IOError as e:
print("Read file E