数据挖掘模型

最新推荐文章于 2023-12-20 19:22:54 发布

Just love ℡

最新推荐文章于 2023-12-20 19:22:54 发布

阅读量1k

点赞数

本文链接：https://blog.csdn.net/weixin_67640611/article/details/127072085

版权

本文详细介绍了数据挖掘中的各类模型，包括监督学习的决策树、贝叶斯方法、神经网络、支持向量机和集成学习分类模型；无监督学习的K-means聚类、基于密度的聚类、层次聚类和谱聚类；以及半监督学习和文本处理模型的应用。通过这些模型，可以有效地处理和分析数据，实现分类和预测任务。

摘要由CSDN通过智能技术生成

数据挖掘常用的模型如下：

3.1 监督学习模型

就是人们常说的分类，通过已有的训练样本（即已知数据以及其对应的输出）去训练得到一个最优模型（这个模型属于某个函数的集合，最优则表示在某个评价准则下是最佳的），再利用这个模型将所有的输入映射为相应的输出，对输出进行简单的判断从而实现分类的目的，也就具有了对未知数据进行分类的能力。

3.1.1决策树：

决策树是用于分类和预测的主要技术之一，决策树学习是以实例为基础的归纳学习算法，它着眼于从一组无次序、无规则的实例中推理出以决策树表示的分类规则。构造决策树的目的是找出属性和类别间的关系，用它来预测将来未知类别的记录的类别。它采用自顶向下的递归方式，在决策树的内部节点进行属性的比较，并根据不同属性值判断从该节点向下的分支，在决策树的叶节点得到结论。

主要的决策树算法有ID3、C4.5（C5.0）、CART、PUBLIC、SLIQ和SPRINT算法等。它们在选择测试属性采用的技术、生成的决策树的结构、剪枝的方法以及时刻，能否处理大数据集等方面都有各自的不同之处。

3.1.2 贝叶斯方法：

贝叶斯（Bayes）分类算法是一类利用概率统计知识进行分类的算法，如朴素贝叶斯（Naive Bayes）算法。这些算法主要利用Bayes定理来预测一个未知类别的样本属于各个类别的可能性，选择其中可能性最大的一个类别作为该样本的最终类别。由于贝叶斯定理的成立本身需要一个很强的条件独立性假设前提，而此假设在实际情况中经常是不成立的，因而其分类准确性就会下降。为此就出现了许多降低独立性假设的贝叶斯分

最低0.47元/天解锁文章

Just love ℡

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
数据挖掘模型

数据挖掘常用的模型如下：3.1 监督学习模型就是人们常说的分类，通过已有的训练样本（即已知数据以及其对应的输出）去训练得到一个最优模型（这个模型属于某个函数的集合，最优则表示在某个评价准则下是最佳的），再利用这个模型将所有的输入映射为相应的输出，对输出进行简单的判断从而实现分类的目的，也就具有了对未知数据进行分类的能力。3.1.1决策树：决策树是用于分类和预测的主要技术之一，决策树学习是以实例为基础的归纳学习算法，它着眼于从一组无次序、无规则的实例中推理出以决策树表示
复制链接

扫一扫