自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

qy20115549的博客

世上成功的方式可能有很多种,但失败的方式就只有一种,那就是半途而废。

  • 博客(4)
  • 资源 (7)
  • 收藏
  • 关注

原创 如何直观的看出主题模型学习结果的好坏

本文作者:合肥工业大学 电子商务研究所 钱洋 email:[email protected] 。内容可能有不到之处,欢迎交流。未经本人允许禁止转载。文章目录主题模型的评估指标直观的展示如何构建类似的矩阵参考论文主题模型的评估指标在主题模型中,常见的评估指标包括Perplexity(即困惑度)以及Coherence Score、Topic Consensus等。而在计算Coherence Score有几种方案:其一是基于点互信息的,如下所示:使用这种方式,需要第三方数据来评估,如这里提及的Wi

2020-07-07 09:08:33 1591 1

原创 嵌套模型(Nested Models)和非嵌套模型(Non-Nested Models) 的统计检验(R语言)

在R语言中,对于嵌套(nest)模型可以使用likelihood ratio tests(似然比检验),对于非嵌套模型(Non-Nested Models) 可以使用Davidson and MacKinnon’s J-test。这两种检验在论文中经常使用如:如下为其代码示例:require(lmtest)## Fit two competing, non-nested models for aggregate ## consumption, as in Greene (1993), Exampl

2020-07-20 10:56:52 12142

原创 Java指定几个标点符号(或分割)分割字符

应用背景在做Sentence-LDA处理时,需要将文本数据按照句子分割。通常分割句子(英文)需要使用句号,问号和叹号。Java案例package sentencedeal;public class Test { public static void main(String[] args) { String line = "I ordered this ? because my original battery ! cover to my. droid x2"; String[] aft

2020-07-17 09:09:27 6842

原创 利用LDA主题模型的生成过程仿真数据

仿真代码因为,最近论文,需要基于图模型的过程,仿真数据。因此,找了一些已有的代码和论文。以下,是利用LDA的生成过程仿真数据的过程,这个代码是使用R语言编写的,代码来源于:https://www.r-bloggers.com/topic-modeling-1-simulated-lda-corpus/(https://gist.github.com/robbymeals/3985469)。### Basic LDA Topic Model Simulation ###### Generate Simu

2020-07-03 10:16:38 1286

Probabilistic Graphical Models - Principles and Techniques.pdf

Probabilistic Graphical Models - Principles and Techniques.pdf高清版,可以下载下来,网上打印书籍哦

2017-01-14

MapDB的jar包

MapDB的jar包可以直接使用

2016-11-17

maven多个下载源

maven经常遇到下载jar包,下载不下来。或者很慢的情况。那是因为下载jar的源是国外源,所以很慢。这个源为开源中国的源。下载速度很快。

2016-11-03

Java多线程网络爬虫(时光网为例)源码

Java多线程网络爬虫(时光网为例)源码,为maven创建,有不明白请看我的博客介绍;转载请用连接注明出处。近期有人,将本人博客直接复制上传到百度文科等平台,不尊重个人努力成果。

2016-10-20

libsvm32位64位

32位64位都可以直接使用

2016-08-20

中文最全停用词表,个人整理(1704个)

由于是个人使用的,所有收集了很多,希望对中文文本处理的同学有所帮助

2016-04-19

金融数据分析导论

基于r语言的金融分析,时间序列分析,面板数据,联立方程模型

2014-12-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除