![](https://img-blog.csdnimg.cn/20190301225226794.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据挖掘算法
数据挖掘方向的学习总结
光明顶上的5G
作者5G,目前专注于Java后端技术的学习
展开
-
集成学习
关于集成学习的基本概念集成学习概念集成学习是机器学习中一个非常重要且热门的分支,是用多个弱分类器构成一个强分类器,其哲学思想是“三个臭皮匠赛过诸葛亮”。一般的弱分类器可以由决策树,神经网络,贝叶斯分类器,K-近邻等构成。已经有学者理论上证明了集成学习的思想是可以提高分类器的性能的,比如说统计上的原因,计算上的原因以及表示上的原因。为什么要集成模型选择:假设各弱分类器间具有一定差异性(如不...原创 2019-05-02 19:34:45 · 336 阅读 · 0 评论 -
决策树
什么是决策树分类决策树模型是一种描述对实例进行分类的树形结构。决策树由节点和有向边组成。节点有两种类型:内部节点和叶节点。内部节点表示一个特征或属性,叶节点表示一个类。...原创 2019-05-02 15:33:28 · 732 阅读 · 0 评论 -
SVM支持向量机
SVM基本思想SVM把分类问题转化为寻找分类平面的问题,并通过最大化分类边界点距离分类平面的距离来实现分类SVM优缺点优点:可以解决小样本下机器学习的问题提高泛化性能可以解决文本分类、文字识别、图像分类等方面问题避免神经网络结构选择和局部极小的问题缺点:缺失数据敏感内存消耗大,难以解释SVM与逻辑回归的区别相同点: 均是常见的分类算法 两个损...原创 2019-05-01 15:33:50 · 343 阅读 · 0 评论 -
朴素贝叶斯分类
贝叶斯定理假设对于某个数据集,随机变量C表示样本为C类的概率,F1表示测试样本某个特征出现到概率,套用基本贝叶斯公式,则如下所示:上式表示对于某个样本特征F1出现时该样本被分为C类的条件概率。先验概率:P©是C的先验概率。证据:P(F1),表示对于测试样本特征F1出现的概率。似然:即上式P(F1|C),表示如果知道一个样本被分为C类,那么它的特征为F1的概率是多少。朴素贝叶斯分类思...原创 2019-05-01 15:12:03 · 143 阅读 · 0 评论 -
KNN算法
算法思路通过计算每个训练样例到待分类样品到距离,取和待分类样品距离最近到K个训练样例,K个样品中哪个类别到训练样例占多数,则待分类样品就属于哪个类别。算法步骤1、初始化距离为最大值2、计算未知样本和每个训练样本到距离dist3、得到目前K个最邻近样本中的最大距离maxdist4、如果dist小于maxdist,则将该训练样本作为K最近邻样本5、重复步骤2、3、46、统计K最近邻样本...原创 2019-04-30 16:32:50 · 291 阅读 · 0 评论