机器学习
文章平均质量分 65
差点儿90后
把一件事情不急功近利地坚持到底,直到有个结果。并且相信这样一句美好的话:越努力,越幸运!
展开
-
模式识别研究方法、研究方向及研究内容
一、研究方法1、模板匹配2、统计方法(统计jue)原创 2014-05-17 18:06:41 · 2393 阅读 · 0 评论 -
关于先验概率、似然函数以及后验概率的一点总结
重要贝叶斯公式:后验概率∝先验概率*似然函数 先验概率: 在贝叶斯分布中,先验概率分布是指关于某个变量X的分布,即是在获得某些信息或者依据前,对变量X的不确定性所作出的猜测。这是对不确定性(而不是随机性)赋予一个量化的数值的表征,这个量化数值可以是一个参数,或者是一个潜在的变量。先验概率依赖于主观上的经验估计,也就是事先根据已有的知识的推断。例如, X 可以是投一枚硬币,正面朝上的概率,显然在我原创 2017-06-30 00:08:03 · 3919 阅读 · 0 评论 -
EM算法理解
看了很多文章,对这个概念总是理解的模模糊糊,今天把它摘抄并写出来,加深一下理解。EM算法,全称是Expectation maximization,期望最大化。摘抄了两位知乎大牛的解释—— 先来看看为什么需要EM算法以下是某知乎大牛的解释: 1 为什么需要EM算法? 我们遇到的大多数问题是这样的: A、已知一堆观测数据X B、和数据服从的统计模型然后利用数据来估计统计模型中的参数解决这个问题原创 2017-07-04 14:51:00 · 3713 阅读 · 0 评论 -
高斯混合模型——感性理解
一)、k-means与高斯混合模型的对比的不足:1)k-means的缺点在于,它是一个hard聚类的方法,比如有一个点任何一个聚类中心都不属于,但是算法仍然可能会把它强行划分到一个聚类中心去。对于一个点,它属不属于某个聚类中心的可能性是个属于(0,1)的整数值。 2)而高斯混合模型(Gaussian Mixture Model) 就是一种soft聚类的方法,它建立在一个重要的假设上,即任意形状的概原创 2017-07-03 18:57:02 · 2603 阅读 · 0 评论 -
推荐系统评测指标—准确率(Precision)、召回率(Recall)、F值(F-Measure)
下面简单列举几种常用的推荐系统评测指标:1、准确率与召回率(Precision & Recall)准确率和召回率是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。其中精度是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率;召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率。一般来说,Precision就是检索出来的条目(比如:文转载 2015-07-18 16:09:28 · 1670 阅读 · 1 评论 -
Ubuntu上如何安装gensim?
Ubuntu上如何gensim?gensim支持主题模型方法LDA(潜在狄利克雷分配,Latent Dirichlet Allocation).安装步骤:安装scipy安装gensim1、安装scipy sudo pip install scipy (版本:0.15.1) 2、安装gensim 在http://radimrehurek.com/gensim原创 2015-07-01 15:08:48 · 3079 阅读 · 0 评论 -
对PCA的学习与总结
PCA这个看似最容易的一个降维算法,但是其内部的yuan转载 2014-05-17 11:04:25 · 1089 阅读 · 0 评论 -
LDA与PCA的一些区别总结
LDA,基本和PCA是一对双生子,它们之间的区别就是PCA是一种unsupervised的映射方法而LDA是一种supervised映射方法,这一点可以从下图中一个2D的例子简单看出转载 2014-05-17 12:14:00 · 7697 阅读 · 1 评论 -
对LDA的学习和总结
最近一直在学人脸识别中的转载 2014-05-17 13:31:25 · 1720 阅读 · 0 评论 -
学习spark ml源码——线性回归
1、参数配置相关代码/** * Params for linear regression. */private[regression] trait LinearRegressionParams extends PredictorParams with HasRegParam with HasElasticNetParam with HasMaxIter with HasTol原创 2017-09-25 20:46:45 · 1063 阅读 · 0 评论