python-pandas模块6-合并数据集

本文详细介绍了Pandas模块中数据集的合并方法,包括pd.merge()的inner连接和多列合并,pd.concat()的Series和Series连接,以及使用combine_first()和combine()函数进行数据融合。通过实例展示了不同合并方式的使用场景和效果。
摘要由CSDN通过智能技术生成

pandas模块-合并数据集

导入模块:

import numpy as np
import pandas as pd
from pandas import Series,DataFrame
from numpy import nan as NA

1.pd.merge() dataframe和dataframe合并

创建两个DataFrame用了来连接

df1=DataFrame(
    {
   'key':list('aabbabc'),'data1':np.arange(7)*10}
)
df1

在这里插入图片描述

df2=DataFrame(
    {
   'key':list('abd'),'data2':np.arange(1,4)*10}
)
df2

在这里插入图片描述

(1)pd.merge采用inner连接 取交集,没有交集的舍弃
pd.merge(df1,df2)

在这里插入图片描述
默认是以相同的列名称为键 进行合并 一般情况下 建议用on=’’ 制定一下

pd.merge(df1,df2,on='key')

在这里插入图片描述
默认 how=‘inner’ 取交集,how=‘outer’ 取并集

pd.merge(df1,df2,how='outer')

在这里插入图片描述

如果没有相同的列

在创建两个没有相同列的DataFrame

df3 = DataFrame(
    {
    'Lkey':list('aabbabc') , 'data1':np.arange(7)*10}
)
df4 = DataFrame(
    {
   'Rkey':list('abd') ,'data2':np.arange(1,4)*10}  
)
print(df3)
print
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值