【数据平台】python数据集连接和组合

场景:dataframe之间的链接,以及list之间的组合。

参考:

# -*- coding: utf-8 -*-
'''
Created on 2017年9月30日

@author: Administrator
'''
import pandas as pd
import itertools
from itertools import product

#merge
df1=pd.DataFrame({'name':['z','q','s','l'],'subid':['1','2','',''],'cid':['c1','','c2','c3']})
print (df1)
df2=pd.DataFrame({'name':['z','q','s','s','g'],'cid':['c1','c2','c2','c3','c1'],'code':['1','2','3','3','2']}) 
print (df2)
#内连接
df_inner=pd.merge(df1,df2,on=['name','cid'],how='inner')    
print (df_inner)
#左连接
df_left=pd.merge(df1,df2,on=['name','cid'],how='left')    
print (df_left)
#右连接
df_right=pd.merge(df1,df2,on=['name','cid'],how='right')    
print (df_right)
#全外连接
df_outer=pd.merge(df1,df2,on=['name','cid'],how='outer')    
print (df_outer)

#join
df1=pd.DataFrame({'name':['z','q','s','l']})
print (df1)
df2=pd.DataFrame({'cid':['c1','c2','c3']}) 
print (df2)
df_join=df1.join(df2)
print (df_join)

#元素两两组合-笛卡尔乘积

list1=['z','q','s','l']
list2=['c1','c2','c3']
list3 = [(x,y) for x in list1 for y in list2]
print (list3)
for x in product(list1, list2):
    print (x)
for x in product(list1, repeat=4):
    print (x)
nums = itertools.permutations(list2)#自身组合
for x in  nums:
    print(x)


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值