LDA模型的原理及其应用:http://www.docin.com/p-122070512.html
LDA(latent dirichlet allocation)的应用:http://www.zhizhihu.com/html/y2013/4219.html
LDA解释:http://yinwenpeng1987.blog.163.com/blog/static/162471582201172133847788/
LDA vs PLSI: http://www.zhihu.com/question/23642556
【JMLR’03】Latent Dirichlet Allocation (LDA)- David M.Blei
http://www.xperseverance.net/blogs/2012/03/17/
Latent Dirichlet Allocation(LDA)主题模型算法实现及源码解析:
http://blog.sina.com.cn/s/blog_8eee7fb60101d06p.html
多项式分布:http://blog.csdn.net/tianguokaka/article/details/7710521
主题模型
:http://blog.sina.com.cn/s/blog_9d7bca9f01015580.html如何使用主题模型?
有了主题模型,我们该怎么使用它呢?它有什么优点呢?我总结了以下几点:
1)
2)它可以解决多义词的问题。回想最开始的例子,“苹果”可能是水果,也可能指苹果公司。通过我们求出来的“词语-主题”概率分布,我们就可以知道“苹果”都属于哪些主题,就可以通过主题的匹配来计算它与其他文字之间的相似度。
3)它可以排除文档中噪音的影响。一般来说,文档中的噪音往往处于次要主题中,我们可以把它们忽略掉,只保持文档中最主要的主题。
4) 它是无监督的,完全自动化的。我们只需要提供训练文档,它就可以自动训练出各种概率,无需任何人工标注过程。
5) 它是跟语言无关的。任何语言只要能够对它进行分词,就可以进行训练,得到它的主题分布。
综上所述,主题模型是一个能够挖掘语言背后隐含信息的利器。近些年来各大搜索引擎公司都已经开始重视这方面的研发工作。语义分析的技术正在逐步深入到搜索领域的各个产品中去。在不久的将来,我们的搜索将会变得更加智能,让我们拭目以待吧。
EPANETH 软件是美国环保局软件EPANET 的汉化版本,是一个可以执行有压管网水力和水质特性延时模拟的计算机程序。管网包括管道、节点(管道连接节点)、水泵、阀门和蓄水池(或者水库)等组件。EPANETH 可跟踪延时阶段管道水流、节点压力、水池水位高度以及整个管网中化学物质的浓度。除了模拟延时阶段的化学成分,也可以模拟水龄和进行源头跟踪。
EPANETH 开发的目的是为了改善对配水系统中物质迁移转化规律的理解。它可以实现许多不同类型的配水系统分析。采样程序设计、水力模型校验、余氯分析以及用户暴露评价就是一些例子。EPANETH 有助于评价整个系统水质改善的不同管理策略
混合模型,潜变量和EM算法(mixture model,latent variable and EM algorithm)
http://site.douban.com/182577/widget/notes/10567212/note/271336847/混合模型:
在线算法:http://en.wikipedia.org/wiki/Online_algorithm
在线算法(online algorithm)和离线(offline algorithm)算法,离线算法也就是知道了所有的输入,根据某些条件来选取最佳策略,而在线算法就是无法预知到后面的输入,只能按照目前的状况来做出下一步的最好决策,在线算法追求的是与离线算法一样的好结果。