23.2.24: pandas中merge函数用于将多个表格中某几列合并成组成一个表格,并设置某列为索引

pd.merge(left, right, on=None, how='inner', ...)

参数:

  • leftright:要合并的左右两个 DataFrame 对象。
  • on:指定用于合并的列名(字符串或列表)。如果未提供,则会根据两个 DataFrame 中相同的列名进行自动匹配。
  • how:指定连接方式,默认为 'inner'。可选的连接方式包括:
  • 'inner':内连接,只保留两个 DataFrame 共有的行。
  • 'outer':外连接,保留两个 DataFrame 所有的行,缺失值用 NaN 填充。
  • 'left':左连接,保留左侧 DataFrame 所有的行,缺失值用 NaN 填充。
  • 'right':右连接,保留右侧 DataFrame 所有的行,缺失值用 NaN 填充。
  • 其他参数:还可以通过其他参数指定更多的合并选项,如 left_onright_onleft_indexright_index 等。

 例子:

import pandas as pd

# 创建示例数据
df1 = pd.DataFrame({'ID': [2,3],
                    'Name': ['Bob', 'Charlie']})
df2 = pd.DataFrame({'ID': [1,2,3,4],
                    'Age': [25,30,35,5]})
df3 = pd.DataFrame({'ID': [1,2,3,4],
                    'yue': [25, 35, 35,5]})

# 使用 merge 函数合并两个 DataFrame
merged_df1 = pd.merge(df1, df2, on='ID')  # 此处行索引取交集,列索引取并集
# 使用 merge 函数合并三个 DataFrame
merged_df2 = pd.merge(df1, df2, on='ID').merge(df3,on='ID')

# 设置时间列为索引
# merged_df.set_index('ID', inplace=True)

# 打印合并后的结果
print(merged_df1)
print(merged_df2)

merged_df1
merged_df2

 设置某列为索引:

# 设置时间列为索引
merged_df.set_index('ID', inplace=True)

# 按索引将时间排序
merged_df= merged_df.sort_index(ascending=True)  # ascending=True 升序排序
merged_df= merged_df.sort_index(ascending=False) # ascending=False 降序排序

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值