python和excel数据分析统计服_数据分析EPHS(4)-使用Excel和Python计算数列统计值

最新推荐文章于 2022-06-26 20:46:46 发布

Googlecat

最新推荐文章于 2022-06-26 20:46:46 发布

阅读量292

点赞数

文章标签： python和excel数据分析统计服

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42510835/article/details/113973166

版权

前面环境都搞的差不多了，这次咱们进入实战篇，来计算一列的统计值。统计值主要有最大值、最小值、均值、标准差、中位数、四分位数。话不多说，直接进入正题。

本文介绍使用Excel和Python来计算上述统计值，而Hive和Spark将放在下一篇中。

1、数据介绍

这里咱们使用的是iris分类数据集，数据下载地址为：

下载后转换为xlsx格式的文件，数据如下：

wAAACwAAAAAAQABAEACAkQBADs=

也可以在公众号后台回复 “iris” 下载相应数据。

2、使用Excel计算统计值

咱们一个个来哈，在使用过程中还是学到了很多东西的，如果你都会了，也建议你看一下，嘻嘻！

2.1 最大值 & 最小值

在Excel统计一列或者指定单元格区间的最大值或最小值，直接使用max和min函数即可：=MAX(A2:A151)

=MIN(A2:A151)

统计结果如下：

wAAACwAAAAAAQABAEACAkQBADs=

2.2 平均值

在Excel统计一列或者指定单元格区间的平均值，直接使用average函数即可：=AVERAGE(A2:A151)

统计结果如下：

wAAACwAAAAAAQABAEACAkQBADs=

2.3 样本标准差 VS 总体标准差

在Excel统计一列或者指定单元格区间的标准差，可就没那么简单了，excel里面共有四个方法：

wAAACwAAAAAAQABAEACAkQBADs=

共四个方法，其实可以分成两组，即统计样本标准差和总体标准差，首先回顾一下二者的计算公式：

wAAACwAAAAAAQABAEACAkQBADs=

总体标准差对应的英文是Population standard deviation , 在Excel中一般使用STDEV.P 或者 STDEVPA方法计算，这里的P便是Population的意思。

样本标准差对应的英文是Sample standard deviation，在Excel中一般使用STDEV.S 或者 STDEVA方法计算，这里的S便是Sample的意思。

这里我们先使用STDEV.P和STDEV.S 分别计算一下总体标准差和样本标准差：=STDEV.P(A2:A151)

=STDEV.S(A2:A151)

结果如下：

wAAACwAAAAAAQABAEACAkQBADs=

接下来说下STDEV.P和 STDEVPA的区别，STDEV.S和STDEVA的区别与其相同。两者区别是 STDEV.P 函数忽略样本中的逻辑值和文本, STDEPV 不忽略，看下面的结果：

wAAACwAAAAAAQABAEACAkQBADs=

在上面的数据中，如果只计算4个数字的总体标准差，结果当然是0，因为四个数字都是2，所以STDEV.P的结果是0，但是STDEVPA的结果却不是0，因为这个函数将文本和逻辑值False当作0处理，把逻辑值True当作1处理，我们来验证下：

wAAACwAAAAAAQABAEACAkQBADs=

结果印证了咱们刚在的说明。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。