(1)数据的类型
按照测量尺度分类
-
名义变量(Normal Variable)
举例:性别,人种
无大小顺序等级之分 -
顺序变量(Oridinal)
举例:教育程度,喜好程度
有大小顺序之分,差距不一定相同 -
等距\区间变量(Interval Variable)
举例:摄氏温度
差距相同,任意零点,不能算倍数 -
等比\比例变量(Ratio Variable)
举例:绝对温度、身高、体重
绝对零点,可算倍数/比率
按照性质分类 -
类别型(Categorical)
-
数值型(Numerical)
离散型:整数、家中人数
连续型:身高、体重
(2)数据的呈现与分析
1.描述性统计分析
数据搜集、数据呈现与数据特征化
总体(population):数值特性称参数,比如均值,标准差,方差等
样本(Sample):数值特性称统计量,比如样本量,样本均值等
集中趋势:均值,对称正态分布,受极端值的影响
中位数:偏态分