《数据挖掘概念与技术》学习笔记第7章(7/10)分类和预测

feliciafay

于 2010-09-03 14:50:00 发布

阅读量1.2k

点赞数

分类专栏： DataMining_MachineLearning 文章标签：数据挖掘算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/feliciafay/article/details/5861464

版权

DataMining_MachineLearning 专栏收录该内容

19 篇文章 0 订阅

订阅专栏

分类

第一步，建立一个模型，描述预定的数据类集或者概念集。

第二步，使用模型进行分类。

补充说明：

1 数据类集或者概念集还可以被称为样本、实例、对象。

2为建立模型而被分析的数据类集称为训练数据集。

3 这是一种有指导的学习，而在聚类中，使用的是无指导的学习。

对分类方法进行评估

可以采用的评估标准包括：预测的准确率、速度、强壮性、可伸缩性、可解释性。

判定树的可伸缩性

大部分判定树算法都把训练样本限制在了内存中，然而包含数以百万计样本的非常大的训练集是很普通的。因此，这一限制就制约了算法的可伸缩性。目前针对此问题的的改进算法是SLIQ和SPRINT，核心解决之道是预排序

贝叶斯分类

算法实现(以后单独写出)

其它分类方法

k-最邻近分类

基于案例的推理(case-based reasoning)

遗传算法

粗糙集方法

模糊集方法

预测

一般认为，如果预测结果是离散值，则应该叫做分类。

如果预测结果是连续值，则应该叫做预测。

预测的方法

线性回归：使用最小二乘法

多元回归

非线性回归

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《数据挖掘概念与技术》学习笔记第7章(7/10)分类和预测

<br />分类<br />第一步，建立一个模型，描述预定的数据类集或者概念集。<br />第二步，使用模型进行分类。<br />补充说明：<br />1 数据类集或者概念集还可以被称为样本、实例、对象。<br />2为建立模型而被分析的数据类集称为训练数据集。<br />3 这是一种有指导的学习，而在聚类中，使用的是无指导的学习。<br />对分类方法进行评估<br />可以采用的评估标准包括：预测的准确率、速度、强壮性、可伸缩性、可解释性。<br /> <br /><br />判定树的可伸缩性<br
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。