主题模型 LDA 源码分享

本文分享了一个使用C++实现的as-lda版本的LDA(潜在狄利克雷分配),该版本采用了非对称的先验设置,有助于在增加主题数量时保持主题分布的稳定性。参考了《Rethinking LDA: Why Priors Matter》的研究,代码包含中文测试数据,特点是易用、内存占用小。同时提供了项目链接和其他机器学习工具如gbdt和adaboost的源码地址。
摘要由CSDN通过智能技术生成

转载请注明来源:http://blog.csdn.net/yihucha166/article/details/9046835

Latent Dirichlet Allocation(LDA)是目前业界最为流行的机器学习方法之一,这里用C++实现了一个as-lda版本,使用了非对称的先验设置,随着主题数的增加,主题分布上比传统模型更加稳定,减少因为主题数量大而导致大量小众主题,参考文献《Rethinking LDA:Why Priors Matter》,代码目录中包含了中文测试数据

代码地址:https://code.google.com/p/as-lda/


 

asymmetric prior Latent Dirichlet Allocation (LDA) by c++

Usually, symmetric dirichlet prior is used in the implementation of lda. in "Rethinking LDA:Why Priors Matter" , they have showed that asymmetric prior can generate better result and stable topic distribution under the increment of topic number. So, in this project, we adopt this algorithm.

other features:
#easy to use, easy to understa

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值