- 博客(3)
- 收藏
- 关注
原创 EM算法简单理解
EM算法是为了解决什么问题?在求解概率模型的时候,如果需要的变量都是观测变量,不涉及到隐藏变量的话,可以使用极大似然或者贝叶斯估计来求解模型的参数。比如:对于单高斯模型来讲,如果知道观测变量,那么就可以使用极大似然或者最小均方误差来估计高斯模型的均值和方差。如果模型同时包含观察变量和隐藏变量的话,传统的方法不能完成模型的估计,此时就需要引入EM算法。比如:对于混合高斯模型来讲,除了需要估计
2015-09-29 18:05:29 2313
原创 条件随机场CRF简介
Crf模型1. 定义一阶(只考虑y前面的一个)线性条件随机场:相比于最大熵模型的输入x和输出y,crf模型的输入输出都是序列化以后的矢量,是对最大熵模型的序列扩展。相比于最大熵模型的另外一个不同是,crf多出了一个维度j(j表示序列x的位置),即任意一个输出yi,都跟所有的输入x有关。经过变换,crf概率模型可以转化为
2015-09-28 21:25:36 12631 2
翻译 MapReduce
mapreduce的执行一、执行流程Map将输入分割为M片,reduce将中间件分为R片(比如使用hash函数),详细步奏如下:1. 用户程序中的Mapreduce库首先将输入文件分为M片(比如每片文件16到64MB),复制到集群中的worker上。2. 集群中的master负责给worker分配任务。将M个map任务和R和reduce任务分配给空闲的w
2015-09-05 22:46:54 1309
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人