import numpy as np
import pandas as pd
df=pd.DataFrame([[1.4,np.nan],[7.1,-4.5],
[np.nan,np.nan],[0.75,-1.3]],
index=['a','b','c','d'],
columns=['one','two'])
df
1.创建一个表
2.对表格每一列求和
df.sum()
3.对表格每一行求和
df.sum(axis=1)
4.每一列的最大值
df.idxmax()
5.每一列向下求和
- 默认axis=0
df.cumsum()
6.缺失值填充
df1 = df.fillna(1)
df1
7.差分值
- 原数据
df1.one = [0,1,2,3]
df2 = df1.drop(['two'],axis=1)
df2
c = pd.DataFrame({'two':np.array([6,8,55,12])},index=['a','b','c','d'])
c
m = pd.concat([df2,c],axis=1)
m
df2.diff()
-
差分后的结果
-
将该列向下平移一格,然后进行相减
-
里面数字为几就是平移几格,然后相减
-
如: df2.diff(2) 向下平移俩格然后相减
8.向上平移一格
- df2.shift(-1)
9.查看汇总统计
m.describe([.88])
10.每一列最大值
m.apply(lambda x:x.max()) # axis=0
- 每一行最大值
df.apply(lambda x:x.max(),axis=1)
11.每一个数据加俩位小数点
m.applymap(lambda x:'%.2f'%x)