pandas 统计 数据链接
统计
df1=pd.DataFrame(np.random.randint(-10,10,(4,5)),index=list('ABCD'),columns=list('abcde'))
print('df1','\n',df1)
print()
求和
print(df1.sum())
print(df1.sum(axis=1))
print()
平均值
print(df1.mean())
print(df1.mean(axis=1))
print()
中位数
print(df1.median())
print(df1.median(axis=1))
print()
各种统计函数结果
print(df1.describe())
print()
数据链接
df1=pd.DataFrame({
'key':list('abcdefgh'),'data1':np.random.randint(-5,10,8)
})
df2=pd.DataFrame({
'key':list('abcde'),'data2':np.random.randint(-5,10,5)
})
按照key值内联接(交集)
print(pd.merge(df1,df2,on='key'))
print('######################')
df1=pd.DataFrame({
'key1':list('abcdefgh'),'data1':np.random.randint(-5,10,8)
})
df2=pd.DataFrame({
'key2':list('abcde'),'data2':np.random.randint(-5,10,5)
})
按照key1和key2链接,内连接交集
print(pd.merge(df1,df2, left_on='key1', right_on='key2'))
print()
外链接并集
print(pd.merge(df1,df2, left_on='key1', right_on='key2', how='outer'))
print('#####################')
以key1为左链接
print(pd.merge(df1,df2, left_on='key1', right_on='key2', how='left'))
以key2为右链接
print(pd.merge(df1,df2, left_on='key1', right_on='key2', how='right'))