机器学习
菜鸟起飞记
这个作者很懒,什么都没留下…
展开
-
原型聚类算法
1、K均值算法 step1:从样本中选取k个样本作为原型向量() Repeat: step2:分别计算样本xj与每个原型向量之间的距离dji,样本xj与哪个向量之间的距离最短,就把该样本归为该原型向量所在的簇,对每一个样本都需要进行归簇过程。 step3:step2完成之后,所有的样本都归为某一簇中,此时再分别计算每一簇中的样本均值向量,...原创 2018-09-11 17:42:29 · 2460 阅读 · 0 评论 -
贝叶斯分类器基本理解
基于贝叶斯分类器的分类问题主要是要求得:对于任一样本X,选择能够使得后验概率最大的类标记。一般,后验概率难以直接获得,可以通过条件概率的公式对后验概率进行一个转换:,对于给定样本p(X)与类标记无关,因此只需要基于训练数据集估计。其中,是先验概率,是类条件概率。由于类条件概率涉及到多个属性的联合分布,难以从有限的训练样本中得到,故在朴素贝叶斯分类器中假设“各属性条件独立”,则。到这里,可以得出,由...原创 2018-09-09 21:11:02 · 1142 阅读 · 0 评论 -
集成学习方法的简单理解
集成学习方法主要包括两大类:1、boosting集成学习方法 boosting是一种串行式集成学习方法,集成中的个体学习器之间是相互依赖的,首先在初始训练集上训练得到一个模型,然后基于该模型改变下一次训练样本的分布,使那些在上一次的模型中分类错误的训练样本在下一次模型学习的过程中得到重视,从而得到新的模型,多次重复这样的训练过程,得到t个训练模型,最终的分类结果由各个训练模型的加...原创 2018-09-11 10:54:59 · 551 阅读 · 0 评论