统计学习
文章平均质量分 78
汗青传奇
这个作者很懒,什么都没留下…
展开
-
统计学习方法-概率知识补充
1.联合分布,条件概率密度:转载 2013-09-09 10:31:39 · 696 阅读 · 0 评论 -
从最大似然到EM算法浅解
From:http://blog.csdn.net/zouxy09 从最大似然到EM算法浅解 机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人做不了的事。那么EM算法能解决什么问题呢?或者说EM算法是因为什么而来到这个世界上,还吸引转载 2016-07-07 22:02:25 · 697 阅读 · 0 评论 -
数据挖掘中所需的概率论与数理统计知识(补充)
1.极大似然估计原理详解:原创 2013-11-13 20:38:56 · 973 阅读 · 0 评论 -
关于Beta分布、二项分布与Dirichlet分布、多项分布的关系
From :转载 2014-11-21 10:20:04 · 5738 阅读 · 1 评论 -
数理统计与概率知识杂谈
1.原创 2014-07-11 18:29:06 · 786 阅读 · 0 评论 -
统计学习方法-主成分分析(Principal Component Analysis ,PCA )
主成分分析 ( Principal Component Analysis , PCA )是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间.原创 2013-09-27 10:48:07 · 10958 阅读 · 1 评论 -
EM、隐马尔科夫模型、条件随机场
原创 2013-12-19 20:00:28 · 989 阅读 · 0 评论 -
朴素贝叶斯
1.贝叶斯法则机器学习的任务:在给定训练数据D时,确定假设空间H中的最佳假设。最佳假设:一种方法是把它定义为在给定数据D以及H中不同假设的先验概率的有关知识下的最可能假设。贝叶斯理论提供了一种计算假设概率的方法,基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身。2.先验概率和后验概率用P(h)表示在没有训练数据前假设h拥有的初始概率。P(h)被原创 2013-11-12 22:05:33 · 824 阅读 · 0 评论 -
统计学习方法-Logistic(逻辑斯蒂)回归
reference: http://f.dataguru.cn/thread-128261-1-1.html我们在做线性回归分析时,其实是用y=mx+b直线去拟合我们的样本点,如果样本点和直线拟合很好,我们就可以得出样本点的线性相关性很强,通常用决定系数R2来表示。在寻找拟合直线的方法是最小二乘法,其实质就是找样本点离直线距离的最小平方和。这个我在白话线性回归中已经讲到。前面我都参考KHA原创 2013-11-11 18:23:19 · 5406 阅读 · 0 评论 -
数据挖掘中所需的概率论与数理统计知识
come from:http://blog.csdn.net/v_july_v/article/details/8308762 向博主致敬! (关键词:微积分、概率分布、期望、方差、协方差、数理统计简史、大数定律、中心极限定理、正态分布)导言:本文从微积分相关概念,梳理到概率论与数理统计中的相关知识,但本文之压轴戏在本文第4节(彻底颠覆以前读书时大学课本灌输给你的观念,一探正态分转载 2013-11-06 16:05:15 · 1775 阅读 · 0 评论 -
话题模型-topic model
reference:http://blog.csdn.net/xianlingmao/article/details/70761651.话题模型(topic model)的提出及发展历史topic model 是一种应用十分广泛的产生式模型(generative model),在IR, NLP,ML都有广泛的应用,本文将对目前已有的topic model进行分类总结,然后选择几个代表性原创 2013-10-31 19:46:30 · 4596 阅读 · 1 评论 -
统计学习方法附录C-拉格朗日对偶性
在学习最大熵模型和SVM的过程中,我们看到,前者需要求解满足所有已知条件并且使得熵最大的模型,后者需要求解满足间隔一致性约束条件并且使得几何间隔最大的超平面,归结起来其求解问题都是带约束的极值问题,其解决方法一般采用拉格朗日对偶原理,对于概率性问题也可以用极大似然法来求解。下面简单介绍拉格朗日对偶原理拉格朗日对偶原理:约束条件可以分成不等式约束条件和等式约束条件,只有等式约束条件的问题我们转载 2013-10-29 15:09:36 · 1094 阅读 · 0 评论 -
概率图模型基础
以PLSA和LDA为代表的文本语言模型是当今统计自然语言处理研究的热点问题。这类语言模型一般都是对文本的生成过程提出自己的概率图模型,然后利用观察到的语料数据对模型参数做估计。有了语言模型和相应的模型参数,我们可以有很多重要的应用,比如文本特征降维、文本主题分析等等。本文主要介绍文本分析的三类参数估计方法-最大似然估计MLE、最大后验概率估计MAP及贝叶斯估计。1、最大似然估计MLE转载 2014-09-17 16:12:46 · 4171 阅读 · 0 评论