数据合并与分组
数据合并
- df_l.join(df_r) 默认情况下是把行索引相同的数据合并到一起
import
- pd.merge(df_l,df_r) 按照指定的列把数据按照一定的方式合并到一起
- how 指定拼接方式;inner,outer,left,right。默认是inner
- on 需要连接的列名。注:必须是公共列
- left_on 左边数组中用作连接的列
- right_on 右边数组中用作连接的列数据分组与聚合
import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(12).reshape(3,4),index=list("abc"),columns=list("ABCD"))
df1=pd.DataFrame(np.arange(10).reshape(2,5),index=list("ab"),columns=list("AFGHI"))
print(df)
print(df1)
print(pd.merge(df,df1))
#输出结果
A B C D F G H I
0 0 1 2 3 1 2 3 4
数据分组与聚合
数据包含在Series、DataFrame数据结构中,可以根据一个或多个键分离到各个组中。分组操作之后,一个函数就可以应用到各个组中,产生新的值。如下图则是简单的分组聚合过程。
groupby的使用
import