机器学习分类和预测任务

分类和预测是两种使用数据进行预测的方式,可用来确定未来的结果。

分类是用于预测数据对象的离散类别的,需要预测的属性值是离散的、无序的。

预测则是用于预测数据对象的连续取值的,需要预测的属性值是连续的、有序的。

分类的基本概念

分类算法反映的是如何找出同类事物的共同性质的特征型知识和不同事物之间的差异性特征知识。分类是通过有指导的学习训练建立分类模型,并使用模型对未知分类的实例进行分类。分类输出属性是离散的、无序的。

分类技术在很多领域都有应用。当前,市场营销的很重要的一个特点就是强调客户细分。采用数据挖掘中的分类技术,可以将客户分成不同的类别。

其他分类应用还有文献检索和搜索引擎中的自动文本分类技术,安全领域的基于分类技术的入侵检测等。

分类就是通过对已有数据集(训练集)的学习,得到一个目标函数 f(模型),来把每个属性集 X 映射到目标属性 y(类)上(y 必须是离散的)。

分类过程是一个两步的过程:第一步是模型建立阶段,或者称为训练阶段,第二步是评估阶段。

1)训练阶段

训练阶段的目的是描述预先定义的数据类或概念集的分类模型。该阶段需要从已知的数据集中选取一部分数据作为建立模型的训练集,而把剩余的部分作为检验集。通常会从已知数据集中选取 2/3 的数据项作为训练集,1/3 的数据项作为检验集。

2)评估阶段

在评估阶段,需要使用第一阶段建立的模型对检验集数据元组进行分类,从而评估分类模型的预测准确率

预测的基本概念


预测模型与分类模型类似,可以看作一个映射或者函数 y=f(x),其中,x 是输入元组,输出 y 是连续的或有序的值。与分类算法不同的是,预测算法所需要预测的属性值是连续的、有序的,分类所需要预测的属性值是离散的、无序的。

数据挖掘的预测算法与分类算法一样,也是一个两步的过程。测试数据集与训练数据集在预测任务中也应该是独立的。预测的准确率是通过 y 的预测值与实际已知值的差来评估的。

预测与分类的区别是,分类是用来预测数据对象的类标记,而预测则是估计某些空缺或未知值。例如,预测明天上证指数的收盘价格是上涨还是下跌是分类,但是,如果要预测明天上证指数的收盘价格是多少就是预测。
 

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值