刚刚使用Python进行数据分析,分享一些概念和想法,希望可以大家一起讨论,如果理解或者表达有不准确的地方,请多多指点,不吝赐教,非常感谢~~
本文将介绍Pandas操作的最后一个部分,前两篇分别是:
《Pandas的基础操作:介绍/创建/查看数据/赋值/常用函数》:https://blog.csdn.net/weixin_42969619/article/details/96863875
《Pandas的基础操作:合并数据.merge()函数的使用》:https://blog.csdn.net/weixin_42969619/article/details/97132359
《Pandas的基础操作:排序/设置行索引》:https://blog.csdn.net/weixin_42969619/article/details/97113118
**在之前的文章里介绍了一些pandas常用函数的接口,略有修改,表格如下:
常用接口 | 参数 | 返回值 | 说明 | |
---|---|---|---|---|
1 | data.mean() | axis=0/1默认值为0 | Series | 求列平均值 |
2 | data.std() | axis=0/1默认值为0 | Series | 求每列的标准差 |
3 | data.var() | axis=0/1默认值为0 | Series | 求每列的方差 |
4 | data.median() | axis=0/1默认值为0 | Series | 求每列的中位数 |
5 | data.min() | axis=0/1默认值为0 | Series | 求每列的最小值 |
6 | data.max() | axis=0/1默认值为0 | Series | 求每列的最大值 |
7 | data.sum() | axis=0/1默认值为0 | DataFrame/Series | 对每列求和 |
8 | data.cumsum() | axis=0/1默认值为0 | DataFrame/Series | 对每行进行累加 |
9 | data.count() | axis=0/1默认值为0 | DataFrame/Series | 按列统计非空元素个数 |
10 | data.nunique() | axis=0/1默认值为0 | int/Series | 统计Series中不同值的个数/统计DataFrame中每列中几个不同值 |
11 | data_series.mode() | Series | 常用在返回对Series中出现最多的元素 | |
12 | data_series.unique() | ndarray | 只能用在统计Series中存在的不重复元素 | |
13 | data_series.value_counts() | Series | 只能用在统计Series中每个元素出现的次数 |
以下列数据作为例子:
# np.random.seed(1)
index =