- 博客(4)
- 资源 (1)
- 收藏
- 关注
转载 最大后验估计(MAP)
最大后验估计是根据经验数据获得对难以观察的量的点估计。与最大似然估计类似,但是最大的不同时,最大后验估计的融入了要估计量的先验分布在其中。故最大后验估计可以看做规则化的最大似然估计。 首先,我们回顾上篇文章中的最大似然估计,假设x为独立同分布的采样,θ为模型参数,f为我们所使用的模型。那么最大似然估计可以表示为: 现在,假设θ的先验分布为g。通过贝叶斯理论,对于θ的后验分
2014-05-13 18:49:19 476
转载 中文分词入门之最大匹配法
中文分词在中文信息处理中是最最基础的,无论机器翻译亦或信息检索还是其他相关应用,如果涉及中文,都离不开中文分词,因此中文分词具有极高的地位。中文分词入门最简单应该是最大匹配法了,当年师兄布置给我的第一个学习任务就是实现最大匹配法的分词算法(正向、逆向)。记得当时对自己参考学习最有帮助的是北大詹卫东老师“中文信息处理基础”的课件和源程序,不过他实现的是mfc程序,词表存储在数据库里。自己实现时用纯c
2012-03-19 21:42:24 536
转载 基于字标注的中文分词方法
本文节选自黄昌宁老师和赵海博士在07年第3期《中文信息学报》上发表的《中文分词十年回顾》,旨在介绍目前比较流行的基于字标注的中文分词方法。 在2002年之前,自动分词方法基本上是基于词(或词典)的,在此基础上可进一步分成基于规则和基于统计的两大类。第一篇基于字标注(Character-based Tagging)的分词论文发表在2002年第一届SIGHAN研讨会上,当时并未引起学界的重视。一
2012-03-19 21:40:15 1455
转载 数据挖掘牛人网站(转)
以下是咱经常去的数据挖掘牛人的网站,吸收了很多精华,也开阔了自己的思路。很感谢他们分享的思想,很是值得学习。韩家炜http://www.cs.uiuc.edu/~hanj/著名数据挖掘书籍,《数据挖掘概念和技术》作者,在DM界久负盛名。他的个人主页里面有很多他的papers,都非常经典;还有他所教授的课程,可以下载课件学习。Jian Peihttp://www.cs.sfu.c
2011-12-25 20:43:10 397
LINUX内核源代码情景分析 上下册
2009-10-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人