统计学基础-第一周 描述统计学
统计学分类
统计学的分类有多种,太繁杂,对于我等小白,只需分为两类:描述统计学和推断统计学。
描述统计学
描述统计学,是使用特定的数字或图表来体现数据的集中程度和离散程度。
例:每次考试算的平均分,最高分,各个分段的人数分布等,也是属于描述统计学的范围。
既然说描述统计学是计算数据的集中程度和离散程度。那数据的集中程度和离散程度该如何计算呢?这就需要用到以前高中时学到的均值、中位数、众数、方差和标准差这些家伙了。
描述数据集中程度(集中趋势)
对于一组数据,如果只容许使用一个数字去代表这组数据,那么这个数字应该如何选择??——选择数据的中心,即反映数据集中趋势的统计量。
均值:算术平均数,描述数据的平均水平。
中位数:将数据按大小排列后位于正中间的数描述,描述数据的中等水平。
众数:数据中出现最多的数(所占比例最大的数),描述数据的一般水平
这三个描述数据集中程度的指标的优缺点:
推断统计学
推断统计学,是根据样本数据推断总体数据特征。也就是由少量数据的特征推断出全量数据的特征。
例:产品质量检查,一般采用抽检,根据所抽样本的质量合格率作为总体的质量合格率的一个估计。