通常我们拿到特征后学要分析打指标非常多,例如均值、最大值、最小值等等。
下面讲解一下统计分析,先用字典结构创建一个简单的DataFrame,既方便传输数据,还可以指定索引和列名
#随机生成一个5×3的矩阵,元素取值为100以内的整数
import numpy as np
a = np.random.randint(100,size=(5,3))
a
输出:
array([[72, 8, 93], [21, 62, 7], [69, 76, 19], [ 2, 86, 12], [11, 42, 91]])
df = pd.DataFrame(a, index=['a','b','c','d','e'], columns=['A','B','C'])
df
输出:
#此函数若不指定维度,默认对每列数据进行加操作,相当于df.sum(axis=0)
df.sum()
输出:
A 175 B 274 C 222 dtype: int64