数据挖掘笔记——数据预处理

什么是数据?

    数据对象和属性的集合

一、属性的类型

属性常常用操作来描述,操作有

a. 相异性:

b.顺序大小

c.加法减法

d.乘法与除法

根据这些操作可以将属性分为:

a.      标称属性(Nominal attribute):只能区分是否相等,例如ID

b.      序数属性(Ordinal attribute):可以区分顺序大小,例如成绩分为优良中

c.      区间属性(Interval attribute):有大小之分,而且相加或者差值有意义,例如日期

d.      比率属性(Ratio attribute):差值或者比率都是有意义的,例如:年龄

或者可以根据值的个数分为:离散型属性和连续性属性

非对称属性(asymmetric attribute):出现非零属性值才是重要的

二、数据集类型

1.记录数据

a.数据矩阵:关系数据库中的关系数据

b.文件数据:文档与term组成的表

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值