风迷失的方向-CSDN博客

原创 JAVA中Random类的Random r=new Random()和Random r=new Random(seedValue)的区别

区别在于： Random r=new Random()：每次运行程序时seedValue不一样，得到的随机数序列不一样，一般会这么用Random r=new Random(seedValue): ：每次运行程序得到的随机数序列都是一样的。例如第一次运行程序得到的随机数是 2, 4, 1, 5, 7。那么重启程序，再次得到的随机数还是2, 4, 1, 5, 7原因：Ran

2015-09-29 21:28:49 9478

转载关联规则——FP-Tree算法

原理参考：http://www.cnblogs.com/zhangchaoyang/articles/2198946.html在关联规则挖掘领域最经典的算法法是Apriori，其致命的缺点是需要多次扫描事务数据库。于是人们提出了各种裁剪（prune）数据集的方法以减少I/O开支，韩嘉炜老师的FP-Tree算法就是其中非常高效的一种。支持度和置信度严格地说Apriori和

2015-09-07 10:33:25 6381 3

原创关联规则Java实现

package aprori;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.OutputStreamWriter;import java.io.PrintWriter;import java.io.UnsupportedEncodingException;imp

2015-09-06 15:46:11 4374

package com.alg.qid.kmeans;import java.io.BufferedReader;import java.io.FileInputStream;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputStreamReader;import java.io.Outpu

2015-08-19 09:19:25 12239 1

原创 word2vec词向量模型裁剪简单demo

package com.zhubajie.alg.qid.segword;import java.io.BufferedInputStream;import java.io.BufferedOutputStream;import java.io.BufferedReader;import java.io.DataInputStream;import java.io.DataOutput

2015-08-14 09:31:09 1322

原创 Syntagmatic and Paradigmatic Relations 的代码调试

在研读ACL-2015的论文《Learning Word Representations by Jointly Modeling Syntagmatic and Paradigmatic Relations》的时候，被其清晰的理论推导吸引，正好其研究的领域与自己的工作相关，故想做试验尝试一下。作者提供了开源的代码：https://github.com/FeiSun/WordRep。但是由于Linu

2015-08-06 15:06:24 1137

原创 hive常用命令

1、拉去基本的数据并显示前100行2、带分隔符字符串连接3、查看部分表4、查看表结构5、导出简单的数据6、建表7、查看所有表

2015-06-30 21:33:30 393

原创 Linux下常用命令

1、查看所有的进程的2、文件合并3、查找4、运行脚本5、复制6、检查服务器文件系统磁盘占用情况7、新建脚本文件8、查看当前目录9、删除行10、查看行数11、上传下载文件12、创建文件夹13、运行jar包内存溢出时增加内存14、进入screen

2015-06-30 21:32:47 340

转载 RankNet——基本思想

1. RankNet的基本思想 RankNet方法就是使用交叉熵作为损失函数，学习出一些模型（例如神经网络、决策树等）来计算每个pair的排序得分，学习模型的过程可以使用梯度下降法。2. 方法流程首先，我们要明确RankNet方法的目的就是要学习出一个模型，这个模型就是给文档算法的函数f(d, w)。其中d为文档特征，w为模型参数。输入：que

2015-06-30 16:30:33 1013

原创 RankLib中的归并排序实现

Step one：public static int[] sort(double[] list, boolean asc) { int[] idx = new int[list.length]; for(int i=0;i<list.length;i++) idx[i] = i; return sort(list, idx, asc); }Step two

2015-06-30 10:18:32 489

转载 Solr-4.8.0入门配置说明

转载：http://jingyan.baidu.com/article/e8cdb32b5ae58f37052badad.htmlSolr-4.8.0入门配置说明工具/原料apache-tomcat-7.0.53(TOMCAT8方法相同)jdk-7u55-windows-x64solr-4.8.0WIN

2015-06-24 09:33:13 545

原创 SVM实现垃圾邮件分类（java调用libsvm.jar）

import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.IOException;import java.io.InputStreamReader;import libsvm.svm;import libsvm.svm_model;

2015-06-23 20:14:55 2431 2

原创为什么myeclipse运行时run没错，而debug时却显示词表未被加载？

网上的观点：1、“多线程不能保证时序，debug只是在java vm加了些监控之类的，可能会导致线程切换调度的速度不一样！”目前尚未很好的解决，要么用run运行程序，要么在debug报错时，点击Resume（F8）继续跑吧。

2015-06-17 09:26:38 709

贝叶斯滤波与平滑 bayesian filtering and smoothing

描述了基于贝叶斯框架的滤波方法和平滑方法，用于得到精确的估计结果；该书涉及到了现在通用的一些滤波方法，模型构建更加数学化，使用MATLAB进行仿真。

2017-10-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

zhoujialin的专栏