Machine Learning
文章平均质量分 63
K.Sun
这个作者很懒,什么都没留下…
展开
-
K-means聚类算法
K-means算法又称K均值算法,它是聚类算法中最为简单的算法,也是最为常用的聚类算法。K-means算法主要用于对已知数据集进行非监督聚类,聚类效果的好坏不仅与数据样本有关,而且与聚类质心的选取,以及质心的数目也有很大关系。在聚类算法中,我们已知训练集{x(1),...,x(m)}\{x^{(1)}, ..., x^{(m)}\},我们想把这些数据聚合成一些比较集中的“聚类”。在这里,一般情况下x原创 2017-02-17 12:59:07 · 977 阅读 · 0 评论 -
高斯混合模型(Gaussian Mixture Model,GMM)
先从简单的离散型随机变量看起离散型随机变量P{X=ak}=pk,k=1,2,3,...,nP\{X=a_k\} = p_k, k = 1, 2, 3, ..., n 其中:∑i=1npi=1\sum_{i=1}^n p_i=1 那么它的期望值是:E(X)=∑kakpkE(X)=\sum_k a_kp_k以上都是中学数学知识,那么到了高等数学的概率论与数理统计这门课才开始讨论连续随机变量的情况。如原创 2017-02-17 18:24:09 · 11988 阅读 · 0 评论 -
朴素贝叶斯分类器(Naive Bayes Classifiers)
原文地址:Naive Bayes Classifiers 本文讨论的是朴素贝叶斯分类器( Naive Bayes classifiers)背后的理论以及其的实现。朴素贝叶斯分类器是分类算法集合中基于贝叶斯理论的一种算法。它不是单一存在的,而是一个算法家族,在这个算法家族中它们都有共同的规则。例如每个被分类的特征对与其他的特征对都是相互独立的。开始之前,先看一下数据集。这是一个虚构的数据集,这个翻译 2017-03-03 15:22:04 · 53114 阅读 · 6 评论 -
K邻近算法
K-Nearest Neighbours是机器学习中最基本的聚类算法,它属于监督学习领域,用于模式识别,数据挖掘以及干扰检测等领域。因为其不需要参数,所以在实际应用场景中被广泛应用,对于数据的分布也不需要做任何假设(例如高斯分布就是相反的例子)。给定一些数据(也称为训练数据),它们根据自身属性的坐标做了分类。例如,下表中的数据点包含两个特征: 现在已知另外一组数据点(测试数据),根据对训练集的翻译 2017-05-04 14:58:08 · 547 阅读 · 0 评论