- 博客(6)
- 收藏
- 关注
原创 LDA前言知识
在 2003 年(准确地说应该是 2002 年)D. M. Blei1 提出的 LDA(Latent Dirichlet Allocation2)模型(翻译成中文就是——潜在狄利克雷分配模型),让主题模型火了起来。 LDA根据给定的一篇文档,推测其主题分布。通俗来说,人类根据文档生成过程写成了各种各样的文章,现在人们想让计算机利用LDA干一件事:计算机分析推测网络上各篇文章,分别都写了些啥主
2017-12-31 22:02:53 307 1
原创 LDA基础知识系列 ---- (2)Dirichlet 分布
本节将从Beta分布出发,水到渠成的讲述Dirichlet 分布和Dirichlet-Multinomial共轭,对称Dirichlet 分布的相关内容。 理解LDA,可以分为下述5个步骤: 一个函数:gamma函数 四个分布:二项分布、多项分布、beta分布、Dirichlet分布 一个概念和一个理念:共轭先验和贝叶斯框架 两个模型:pLSA、LDA 一个采样:Gibb
2017-12-31 16:36:10 1490
原创 LDA基础知识系列 ----(1)共轭先验分布
理解LDA,可以分为下述5个步骤: 一个函数:gamma函数 四个分布:二项分布、多项分布、beta分布、Dirichlet分布 一个概念和一个理念:共轭先验和贝叶斯框架 两个模型:pLSA、LDA 一个采样:Gibbs采样 本节以简单明了的叙述方式,讲述先验概率、似然函数、后验概率、同分布,Beta-Binomial共轭等共轭先验分布内容,对必要的推导,讲述其注意事项,避免跳
2017-12-29 21:19:36 1582
原创 主成分分析的方差最大,解析主成份为什么可以(二)
PCA最大方差理论+几何意义转载请注明:云南省高校数据化运营管理工程研究中心博客http://write.blog.csdn.net/mdeditor#!postId=78932615主成份为什么可以 经过主成分在压缩数据之后的数据(主成分得分数据),多个变量变为更少的综合变量,变量个数减少了,还能反映原有数据的信息吗?为什么可以呢?解决以上疑问前我们需要了解PCA理论基础:
2017-12-29 16:09:35 11038
原创 基于隐语义模型的推荐系统
基于隐语义模型通过矩阵分解建立用户和隐类之间的关系,物品和隐类之间的关系,最终得到用户对物品的偏好关系。隐语义模型(LFM)假设我们想要发现 F 个隐类, 我们的任务就是找到两个矩阵 U 和 V。
2017-12-19 20:22:29 8509 1
原创 typora+pandoc:markdown文本转换成word(也可把word转换成markdown哦)
因为想把自己写的博客转换成word,博客是markdown格式,公式什么的又懒得在word里面敲第二遍。于是就找了个方法让.md文本与.doc文本转换。步骤如下1首先,下载typora,一路安装即可。网址为: http://www.softpedia.com/get/Internet/WEB-Design/HTML-Editors/Typora.shtml 下载pandoc,一路安装即可,网址为
2017-12-19 14:44:59 25705 12
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人