1.0 Pandas 中的数据类型:
Series | Dataframe |
---|---|
一维 | 二维的、表格型 |
每个元素都有各自的标签(数字/字符) | 可储存多个不同类型数据,每个轴都有标签 |
可视为一个由带标签的元素组成的 numpy 数组 | 可视为一个 series 的字典 |
2.0 适用于Series和DataFrame数据类型
函数名 | 描述 | 参数说明 | 使用说明 |
---|---|---|---|
.sum() | 求和 | ||
.mean() | 求期望 | ||
DataFrame.count(axis=0, level=None, numeric_only=False) | 求非NaN值的个数 | axis : {0 or ‘index’, 1 or ‘columns’}, 默认为 0 如果为每列生成0或'index'计数。 如果为每行生成1或'columns'计数 level : int 或 str, 可选 如果轴是MultiIndex(分层), 则沿特定级别计数,折叠到DataFrame中。 一个str指定级别名称。 numeric_only : boolean, 默认为 False 仅包含float,int或boolean数据。 | |
.std() | 求标准差 | ||
.var() | 求方差 | ||
.max() | 最大值 | ||
.min() | 最小值 | ||
.median() | 中位数 |
3.0 只适用于Series类型
方法名 | 描述 |
---|---|
.argmin() .argmax() | 计算数据的最小/大值所在位置的索引位置(自动索引) |
.idxmin() .idxmax() | 计算数据的最小/大值所在位置的索引位置(自定义索引) |
参考文章: