【前言】
研0生活从枯燥的寻找数据、寻找数据、寻找数据……整理数据、整理数据、整理数据……开始,很多时候大家更喜欢从各大平台机构花money买来整理好的数据,不同平台间格式存在差异,如我某师姐遇到的问题,一份是统计资料整理过来的数据,一份是购买过来已经简单处理过的数据,某师姐想知道购买的数据是否可靠,整理的数据与购买数据的原始数据是否相同,奈何数据量太大,不便处理,由此诞生了今天的话题。
【问题提出】
两份Excel数据,如何利用pandas进行比较找出数据上的差异(两份数据如下图所示,图1为统计资料数据,其数据简称为指标数据,图2为购买数据,其数据简称为数据库)