统计学含义
统计学是一门收集、处理、分析、解释数据并从数据中得到结论的科学。
数据分析步骤
收集数据----->处理数据----->分析数据----->解释数据
描述性统计分析:
研究数据收集、处理和描述的统计方法
总体规模、对比关系、集中趋势、离散程度、偏态、峰态
推断性统计分析:
研究如何利用样本数据来推断总体特征的统计学方法
估计、假设检验、列联分析、方差分析、相关分析、回归分析
数据的分类
按计量尺度分类:分类型数据、顺序型数据、数值型数据
按来源分类:直接来源、间接来源
按收集方式分类:观测数据、实验数据
按与时间的关系分类:截面数据、时间序列数据、混合数据(面板数据)
按概型分类:离散型数据、连续型数据
描述性统计
think:某超市后台记录了一年内63万多条消费者的消费数据,请问如何做描述性统计分析?
从5个角度进行分析:
1、总体规模的描述-----总量指标
反映在一定时间、空间条件下某种现象的总体规模、总体水平或总成果的统计指标
2、对比关系的描述-----相对指标
是两个有相互联系的指标数值之比(eg:目标完成率=实际完成/计划完成)
3、集中趋势的描述-----平均指标
分类型数据可用众数
顺序型数据可用众数、分位数(eg:上四分位数3n/4、下四分位数据n/4)
数值型数据可用众数、分位数、均值
均值(易受极端值影响):
算术平均值:简单算术平均数、加权算术平均数
加权算术平均值:
几何平均数: