自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

qy20115549的博客

世上成功的方式可能有很多种,但失败的方式就只有一种,那就是半途而废。

  • 博客(4)
  • 资源 (7)
  • 收藏
  • 关注

原创 Dirichlet Process and Stick-Breaking(DP的Stick-breaking 构造)

目录Dirichlet Process简介Stick-Breaking构造Dirichlet Process简介DP是一种非参数贝叶斯模型, 其优点是参数的个数和性质灵活可变, 可通过模型和数据来计算数目, 近年来它已成为机器学习和自然语言处理研究领域中的一个研究热点。举个例子,我们在使用聚类方法k-means时,需要指定k的值(聚成k个簇);在使用LDA时需要指定主题的数目k,但通过DP过程这种

2017-03-14 13:39:49 6410

原创 Collections.shuffle()方法的使用

Collections.shuffle()的作用是对集合进行重新打乱(随机排序)。package hdp;import java.util.*; public class Test { public static void main(String[] args) { List<Integer> list = new ArrayList<Integer>();

2017-03-19 10:59:28 6980

原创 java通过匹配合并数据(数据预处理)

数据描述以下程序是对如下格式的数据进行合并处理。这个表的每一行表示用户id及用户的特征。其中,一个用户只有一个特征向量,即第一列不会重复。 这张表的第一列,表示用户的id,第二列表示用户所看的电影,第三列表示用户对电影的打分(1-13分),第四列表示用户对电影的打分,但分值范围是1-5分。问题描述在做数据预处理时,如何将第二张表添加上用户特征呢?其实,方法很简单,将第二张表的用户id与第一张表的用

2017-03-01 16:15:47 5143

原创 Map排序,获取map的第一值,根据value取key等操作(数据预处理)

这里为了以后自己再做数据预处理使用,做一下笔记。package deal;import java.io.File;import java.util.ArrayList;import java.util.Collections;import java.util.Comparator;import java.util.HashMap;import java.util.Iterator;imp

2017-03-01 10:45:04 30151

Probabilistic Graphical Models - Principles and Techniques.pdf

Probabilistic Graphical Models - Principles and Techniques.pdf高清版,可以下载下来,网上打印书籍哦

2017-01-14

MapDB的jar包

MapDB的jar包可以直接使用

2016-11-17

maven多个下载源

maven经常遇到下载jar包,下载不下来。或者很慢的情况。那是因为下载jar的源是国外源,所以很慢。这个源为开源中国的源。下载速度很快。

2016-11-03

Java多线程网络爬虫(时光网为例)源码

Java多线程网络爬虫(时光网为例)源码,为maven创建,有不明白请看我的博客介绍;转载请用连接注明出处。近期有人,将本人博客直接复制上传到百度文科等平台,不尊重个人努力成果。

2016-10-20

libsvm32位64位

32位64位都可以直接使用

2016-08-20

中文最全停用词表,个人整理(1704个)

由于是个人使用的,所有收集了很多,希望对中文文本处理的同学有所帮助

2016-04-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除