- 博客(4)
- 资源 (7)
- 收藏
- 关注
原创 如何直观的看出主题模型学习结果的好坏
本文作者:合肥工业大学 电子商务研究所 钱洋 email:[email protected] 。内容可能有不到之处,欢迎交流。未经本人允许禁止转载。文章目录主题模型的评估指标直观的展示如何构建类似的矩阵参考论文主题模型的评估指标在主题模型中,常见的评估指标包括Perplexity(即困惑度)以及Coherence Score、Topic Consensus等。而在计算Coherence Score有几种方案:其一是基于点互信息的,如下所示:使用这种方式,需要第三方数据来评估,如这里提及的Wi
2020-07-07 09:08:33 1591 1
原创 嵌套模型(Nested Models)和非嵌套模型(Non-Nested Models) 的统计检验(R语言)
在R语言中,对于嵌套(nest)模型可以使用likelihood ratio tests(似然比检验),对于非嵌套模型(Non-Nested Models) 可以使用Davidson and MacKinnon’s J-test。这两种检验在论文中经常使用如:如下为其代码示例:require(lmtest)## Fit two competing, non-nested models for aggregate ## consumption, as in Greene (1993), Exampl
2020-07-20 10:56:52 12142
原创 Java指定几个标点符号(或分割)分割字符
应用背景在做Sentence-LDA处理时,需要将文本数据按照句子分割。通常分割句子(英文)需要使用句号,问号和叹号。Java案例package sentencedeal;public class Test { public static void main(String[] args) { String line = "I ordered this ? because my original battery ! cover to my. droid x2"; String[] aft
2020-07-17 09:09:27 6842
原创 利用LDA主题模型的生成过程仿真数据
仿真代码因为,最近论文,需要基于图模型的过程,仿真数据。因此,找了一些已有的代码和论文。以下,是利用LDA的生成过程仿真数据的过程,这个代码是使用R语言编写的,代码来源于:https://www.r-bloggers.com/topic-modeling-1-simulated-lda-corpus/(https://gist.github.com/robbymeals/3985469)。### Basic LDA Topic Model Simulation ###### Generate Simu
2020-07-03 10:16:38 1286
Probabilistic Graphical Models - Principles and Techniques.pdf
2017-01-14
Java多线程网络爬虫(时光网为例)源码
2016-10-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人