2.1 数据横向关联合并:merge

本文介绍如何使用Python的merge函数将不同数据列的transaction和transaction_detail数据集合进行合并。重点讨论了合并策略,以transaction_detail为主,选择了特定数据列如'payment_date'和'customer_id'进行合并,并以'transaction_id'为共同列进行左连接(left join)。最终通过示例展示了合并过程及结果,确保数据量与原始数据一致。
摘要由CSDN通过智能技术生成

 

image.png

 

这一节,我们的目标是想把 transaction 数据 transaction_detail 数据 也合并到一起。

和上一节的concat合并(数据列相同)不同,这次的两个数据集合,数据列是不同的。所以,合并时就会有下面的问题:

  1. 是将两个数据集合的数据列全部合并?还是只合并必要的数据列?
  2. 两个数据集合合并的连接点是哪个数据列?

 

带着上面的问题,我们还是回到刘先生的需求:如何让自己的店铺销量越来越好?

  1. 显然从销量的角度,还是以更有利于分析的 transaction_detail 为主,transaction 为辅。也就是说,将 transaction_detail 中的数据列全部合并,而将 transaction 数据 中的部分数据列合并。至于选择哪些数据列,则没有要求,根据你的具体选择而定。这里我们将“payment_date”和“customer_id”合并进来。
  2. 通过观察两个数据集,可以发现共同存在的数据列是“transaction_id”,所以,就以这个数据列作为
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值