python & pandas 比较两个文件并把不同写入第三个文件

最新推荐文章于 2023-03-31 13:49:23 发布

onlyyou624

最新推荐文章于 2023-03-31 13:49:23 发布

阅读量1.7k

点赞数

分类专栏：数据处理数据分析文章标签： python csv 机器学习

本文链接：https://blog.csdn.net/onlyyou624/article/details/107401947

版权

数据处理同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

数据分析

4 篇文章 0 订阅

订阅专栏

import pandas as pd
# 读取第一个文件内容
df_low = pd.read_csv("id_check_total_india_1594870405.csv")
# 读取第二个文件内容
df_more = pd.read_csv("Aadhaar卡简版测试样本.csv")

low_order_id = df_low["order_no"]
more_id = df_more["order_no"]

# 用set 集合找到不同的order id
low_set = set(low_order_id.to_dict().values())
more_set = set(more_id.to_dict().values())

diff_set = more_set - low_set
df_more_dict = df_more.to_dict()
df = pd.DataFrame()
import time

# 循环比对两个dataframe
file_name = f"diff_record_{int(time.time())}"
for d in diff_set:
    for i in df_more.values:
        if d in i:
           # 匹配到order id 就写入第三个文件
            with open(file_name, "a") as f:
                data = ",".join([str(data) for data in i.tolist()])
                f.write(f"{data}\n")

# -*- coding:utf-8 -*-

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

onlyyou624

关注关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
python & pandas 比较两个文件并把不同写入第三个文件

import pandas as pd# 读取第一个文件内容df_low = pd.read_csv("id_check_total_india_1594870405.csv")# 读取第二个文件内容df_more = pd.read_csv("Aadhaar卡简版测试样本.csv")low_order_id = df_low["order_no"]more_id = df_more["order_no"]# 用set 集合找到不同的order idlow_set = set(low_.
复制链接

扫一扫