1. 数据对象和数据类型
- 数据对象:数据的实体,又称样本、实例、数据点或者对象。
1.1 数据属性
属性:是一个数据字段,表示数据对象的一个特征。属性、维、特征和变量都表示属性。
1.2 标称属性
标称属性的值是一些符号和事物的名称,每个值都代表某种类别、编码或者状态。也被称为是分类。
1.3 二元属性
二元属性是一种标称属性,只有两个类别或者状态:0或1,其中0表示该属性不出现,而1表示出现。二元属性又称布尔属性,其两种属性对应true和false。
1.4 序列属性
序列属性是一种属性,其可能的值之间具有有意义的序或者秩评定,但是相继值之间的差值是未知的。
1.5 数值属性
数值属性是定量的,它是可度量的量,用整数或者实数值表示。数值属性可以是区间标度的或比率标度的。
2. 数据的基本统计
2.1 均值
2.2 中位数
2.3 众数
众数是中心趋势度量,数据集的众数是集合中出现最频繁的数。