没有系统学习过统计学,看到《Excel在统计分析中的应用》这本书,感觉值得一读。
从今天开始,快速学习一下这本书。
1. 总体和样本
总体:对一组数据中的每一个元素进行观察
样本:只对一部分元素进行观察
归纳统计学/统计推断:如果样本可以很好地反映总体的特性,可通过样本的分析对总体下结论
描述性统计/演绎统计学:仅描述和分析特定对象而不下结论、不推断
2. 数据类型
连续数据:可取区间内的任何值(受精度限制)
离散数据:仅可取区间内的有限个值
横截面数据:特定时间内一组变量的状况
时间序列数据:某特定变量随时间变化情况
组数据:数据太多时,无法直观地观察其中的规律,有必要进行加工汇总,将其转换为组数据(方法1:使用countif函数,方法2:使用frequency函数)
非组数据:未分组数据
关于如何使用frequency函数分组数据,可参考:
数据分析(入门篇)-第二章-玩转数据分析-Part2(Excel数据分析工具库-描述性统计分析)
名称 | 公式 | 结果 |
最大值 | =MAX(visits) | 3279 |
最小值 | =MIN(visits) | 49 |
极差 | =H4-H5 | 3230 |
分组数 | =CEILING(SQRT(COUNT(visits)),1) | 12 |
分组组距 | =H6/H7 | 269.16667 |
这几个公式比较重要,特别是极差、分组数、分组组距
提示:countif的灵活性高于frequency
3. 数据描述
频率分布图:以等级区间(指数值)作为横轴,以观测值频率作为纵轴
相对频率分布图:观测值数目与纵观测量的比值作为纵轴(与频率分布图形状相似)
累积频率分布图或累积曲线:使用累积频率绘制(由countif函数绘制)
直方图:使用Excel分析工具库中的“直方图”进行分析