[数据挖掘]数据

1. 数据对象和数据类型

  • 数据对象:数据的实体,又称样本、实例、数据点或者对象。
1.1 数据属性

属性:是一个数据字段,表示数据对象的一个特征。属性、维、特征和变量都表示属性。

1.2 标称属性

标称属性的值是一些符号和事物的名称,每个值都代表某种类别、编码或者状态。也被称为是分类。

1.3 二元属性

二元属性是一种标称属性,只有两个类别或者状态:0或1,其中0表示该属性不出现,而1表示出现。二元属性又称布尔属性,其两种属性对应true和false。

1.4 序列属性

序列属性是一种属性,其可能的值之间具有有意义的序或者秩评定,但是相继值之间的差值是未知的。

1.5 数值属性

数值属性是定量的,它是可度量的量,用整数或者实数值表示。数值属性可以是区间标度的或比率标度的。

2. 数据的基本统计

2.1 均值

这里写图片描述

2.2 中位数

这里写图片描述

2.3 众数

众数是中心趋势度量,数据集的众数是集合中出现最频繁的数。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值