利用python进行数据分析之——数据规整化1(ETL)

本文介绍了如何使用Python进行数据分析中的数据规整化,特别是数据集的合并。通过pandas库的merge和concat函数,实现了类似数据库的SQL连接操作,包括基于键的合并和轴向连接。此外,还提到了suffixes参数在处理重叠列名时的作用。
摘要由CSDN通过智能技术生成

待我学有所成,结发与蕊可好。@夏瑾墨 by Jooey

合并数据集

  1. 数据库风格的DataFrame合并
  2. 索引上的合并
  3. 轴向连接

1.数据库风格的DataFrame合并

import pandas as pd
from pandas import Series,DataFrame
#一对多
df1=DataFrame({
  'key':['b','b','a','c','a','a','b'],'data1':range(7)})
df2=DataFrame({
  'key':['a','b','d'],'data2':range(3)})
pd.merge(df1,df2) #merge默认inner连接,结果中的键是交集。
pd.merge(df1,df2,on='key')

这里写图片描述

df3=DataFrame({
  'lkey':['b','b','a','c','a','a','b'],'data1':range(7)})
df4=DataFr
  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值