![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 71
奔跑的xdr
奔跑的xdr
展开
-
挖掘算法系列大纲
上学期学了数据挖掘,对一些经典的算法有了一定的了解,想把这些算法的思想、自己的理解、使用每个算法的一个代码实践完成和整理一下,完成一个自己的挖掘算法系列笔记。这些算法分别属于:频繁项集的发现、分类、聚类、离群点检测。另外挖掘流式数据、推荐系统这两个附加课题也有一些经典的算法需要整理。数据挖掘领域除重要算法之外还有一些统计相关的概念问题,如果有时间也可以复习整理一下。 【算法大纲】 频繁项集的发现原创 2017-12-16 19:24:00 · 245 阅读 · 0 评论 -
分类算法——决策树
决策树: 非叶节点表示根据属性判断,分枝表示判断结果流向,叶节点表示分类结果(类标号)主要流程: 1)选择在这一层用哪个属性作分类属性(这里的选择标准就是属性选择度量) 2)根据1)在当前节点进行数据的分类 3)按上两个步骤做下去,直到到达叶节点问题细节: 何时到达叶节点、叶节点的节点值怎么确定: 1、如果流到这个分枝的所有数据都已经属于同一个类了,那么这就是个叶节点,节点值就是这个类的原创 2017-12-16 21:21:45 · 309 阅读 · 0 评论 -
分类算法——朴素贝叶斯
分类算法: 使用训练集(数据元组+对应类标号),选用某种分类算法进行监督学习,得到一个分类器;再使用和训练集没有重合的检验集来使用分类器分类,检验分类器的准确率。如果准确率可以接受,那这个分类器就可以用啦。朴素贝叶斯分类法: 用途:给定一个元组,可以计算出这个元组应被分到某个类的概率。 原理:利用贝叶斯公式算出以给定元组矢量值为条件,在训练集上计算出现类i的概率,能使这个条件概率取最大值的类i原创 2017-12-16 20:59:59 · 516 阅读 · 0 评论