统计学定义:
统计学是一门收集,处理,分析,解释并从中得出结论的科学。
核心:数据
数据分析步骤:收集数据=》处理数据=》分析数据=》解释数据
统计学运用在分析数据的方法分为两大类:
描述性数据方法。总体规模、对比关系、集中趋势、离散程度、偏态、 峰态、......
推断性数据分析方法。估计、假设检验、列联分析、方差分析、相关分析、 回归分析、......
描述统计、推断统计两大类
统计学的对象是数据
数据有两种形式:数字和文字。
如何区分文字和数字:是否可以运算。
将数据按照计量尺度不同分三种:
计量尺度为四种:分类尺度、顺序尺度、间隔尺度、比率尺度
注:间隔尺度和比率尺度的区别在于
间隔尺度:对事物类别或次序之间距离的测度,通常用自然或物理单位作为计量尺度,没有绝对零点,且可以相加减,但不能乘除;
定比尺度:有绝对零点,可以加减乘除运算。
分类型数据:数据表现为类别,文字型数据。
顺序型数据:数据表现为类别,文字型数据。
数值型数据:结果表现为具体的数字。
分类型和顺序型数据称为:定性数据。
数值型数据称为:定量数据。
数据的分类:
分法 | 低级————>高级 | |||
两类 | 定性 | 定量 | ||
三类 | 分类 | 顺序 | 数值 | |
四类 | 分类 | 顺序 | 定距 | 定比 |
低级数据的方法高级数据可以用,而高级数据的方法低级数据不可用
数据预处理概念:
数据预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等