文章目录
前言
问题:对两个一一对应的txt文本文件进行去重操作,将结果保存
解决:pandas.concat & pandas.DataFrame.drop_duplicates
pandas.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=True)
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)
一、代码
1. 保存到两个txt文件
def to2txt(file1_path,file2_path,file1,file2):
"""
对两个一一对应的txt文本文件进行去重,分别写入两个文件
:param file1_path: 文本1
:param file2_path: 文本2
:param file1: 输出文本1
:param file2: 输出文本2
:return:
"""
# read_csv读文件的时候ÿ