什么是统计?
统计是一些数字,它们通过某种有意义的方式对原始事实和数字进行提炼,使得仅仅通过观察原始数据无法立即水落石出的一些理念得以昭示。对统计的研究包括:统计数据的来源,计算方法及有效使用方法并得出结论。
为什么要学习统计学?
统计是以事实为基础,只要得到可靠的统计量,就能作出客观的决策,如有神助工进行精确的预测,还可以以有效的方式传达目标信息
什么是描述统计学?
描述统计学,我的理解是指通过图表形式对所搜集到的数据进行加工处理可视化后,分析得出规律。
描述统计常用的指标有哪些呢?
一 平均值
优点:信息量大
缺点:易受极端值的影响
二 四分位数
四分位数也称四分位点,是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值
优点:不易受异常值影响
分为上四分位数和下四分位数
可以使用Excel中的QUARTILE 函数 计算四分位数的数值;
四分位数可以识别出可能的异常值, 对异常值进行检查和处理
识别出可能的异常值:tukey‘s test方法
最小估计值:Q1-k(Q3-Q1)
最大估计值:Q3-k(Q3-Q1)
k=1.5 中度异常
k=3极度异常
三 标准差
标准差是描述典型值与均值距离的一种方法,描述数据的波动性。标准差越小,数值离均值越近。
变异系数(CV)=标准差/平均值
比较两组数据离散程度大小