pandas学习第5章---合并

最新推荐文章于 2024-07-12 16:16:27 发布

Rolland liu

最新推荐文章于 2024-07-12 16:16:27 发布

阅读量183

点赞数

分类专栏：人工智能文章标签： python 数据分析

本文链接：https://blog.csdn.net/rolland_1987/article/details/105832915

版权

一、append与assign

1. append方法

（1）利用序列添加行（必须指定name）

#获取列为'Gender'、'Height'的前4行（loc包含右端点）
df_append = df.loc[:3,['Gender','Height']].copy()
df_append

#利用Series在df_append后添加一行
s = pd.Series({
   'Gender':'F','Height':188},name='new_row')
df_append.append(s)

（2）用DataFrame添加表

#在df_append后面添加一个定义好的DataFrame
df_temp = pd.DataFrame({
   'Gender':['F','M'],'Height':[188,176]},\
index=['new_1','new_2'])
df_append.append(df_temp)

2. assign方法

该方法主要用于添加列，列名直接由参数指定

#添加一个列名为letter，内容为abcd的列
s = pd.Series(list('abcd'),index=range(4))
df_append.assign(Letter=s)

#一次添加多个列，添加2列，col1和col2
df_append.assign(col1=lambda x:x['Gender']*2,
                 col2=s)

二、combine与update

combine和update都是用于表的填充函数，可以根据某种规则填充

1. combine方法

（1）填充对象

可以看出combine方法是按照表的顺序轮流进行逐列循环的，而且自动
索引对齐，缺失值为NaN，理解这一点很重要
Function that takes two series as inputs and return a Series or a
scalar. Used to merge the two dataframes column by columns.

df_combine_1 = df.loc[:1,['Gender','Height']].copy()
df_combine_2 = df.loc[10:11,['Gender','Height']].copy()
df_combine_1.combine(df_combine_2,lambda x,y:print(x,y))

（2）例子

# 例子1，根据列均值的大小填充，填充列均值大的DataFrame
df1 = pd.DataFrame({
   'A': [1, 2], 'B': [3, 4]})
df2 = pd.DataFrame({
   'A': [8, 7], 'B': [6, 5]})
df1.combine(df2,lambda x,y:x if x.mean()>y.mean() else y)

#例子2，索引对齐特性（默认状态下，后面的表没有的行列都会设置为NaN）
#df2 中没有的行和列即A的都会设置为NaN
df2 = pd.DataFrame({
   'B': [8, 7], 'C': [6, 5]},index=[1,2])
df1.combine(df2,lambda x,y:x if x.mean()>y.mean() else y

最低0.47元/天解锁文章

Rolland liu

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
pandas学习第5章---合并

import numpy as npimport pandas as pddf = pd.read_csv('data/table.csv')df.head()一、append与assignappend方法（1）利用序列添加行（必须指定name）#获取列为'Gender'、'Height'的前4行（loc包含右端点）df_append = df.loc[:3,['Gender...
复制链接

扫一扫