- 博客(4)
- 资源 (7)
- 收藏
- 关注
原创 Dirichlet Process and Stick-Breaking(DP的Stick-breaking 构造)
目录Dirichlet Process简介Stick-Breaking构造Dirichlet Process简介DP是一种非参数贝叶斯模型, 其优点是参数的个数和性质灵活可变, 可通过模型和数据来计算数目, 近年来它已成为机器学习和自然语言处理研究领域中的一个研究热点。举个例子,我们在使用聚类方法k-means时,需要指定k的值(聚成k个簇);在使用LDA时需要指定主题的数目k,但通过DP过程这种
2017-03-14 13:39:49 6415
原创 Collections.shuffle()方法的使用
Collections.shuffle()的作用是对集合进行重新打乱(随机排序)。package hdp;import java.util.*; public class Test { public static void main(String[] args) { List<Integer> list = new ArrayList<Integer>();
2017-03-19 10:59:28 6980
原创 java通过匹配合并数据(数据预处理)
数据描述以下程序是对如下格式的数据进行合并处理。这个表的每一行表示用户id及用户的特征。其中,一个用户只有一个特征向量,即第一列不会重复。 这张表的第一列,表示用户的id,第二列表示用户所看的电影,第三列表示用户对电影的打分(1-13分),第四列表示用户对电影的打分,但分值范围是1-5分。问题描述在做数据预处理时,如何将第二张表添加上用户特征呢?其实,方法很简单,将第二张表的用户id与第一张表的用
2017-03-01 16:15:47 5143
原创 Map排序,获取map的第一值,根据value取key等操作(数据预处理)
这里为了以后自己再做数据预处理使用,做一下笔记。package deal;import java.io.File;import java.util.ArrayList;import java.util.Collections;import java.util.Comparator;import java.util.HashMap;import java.util.Iterator;imp
2017-03-01 10:45:04 30151
Probabilistic Graphical Models - Principles and Techniques.pdf
2017-01-14
Java多线程网络爬虫(时光网为例)源码
2016-10-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人