自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (1)
  • 收藏
  • 关注

原创 JAVA中Random类的Random r=new Random()和Random r=new Random(seedValue)的区别

区别在于: Random r=new Random():每次运行程序时seedValue不一样,得到的随机数序列不一样,一般会这么用Random r=new Random(seedValue): :每次运行程序得到的随机数序列都是一样的。例如第一次运行程序得到的随机数是 2, 4, 1, 5, 7。那么重启程序,再次得到的随机数还是2, 4, 1, 5, 7原因:Ran

2015-09-29 21:28:49 9421

转载 关联规则——FP-Tree算法

原理参考:http://www.cnblogs.com/zhangchaoyang/articles/2198946.html在关联规则挖掘领域最经典的算法法是Apriori,其致命的缺点是需要多次扫描事务数据库。于是人们提出了各种裁剪(prune)数据集的方法以减少I/O开支,韩嘉炜老师的FP-Tree算法就是其中非常高效的一种。支持度和置信度严格地说Apriori和

2015-09-07 10:33:25 6364 3

原创 关联规则Java实现

package aprori;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.OutputStreamWriter;import java.io.PrintWriter;import java.io.UnsupportedEncodingException;imp

2015-09-06 15:46:11 4355

原创 词向量的kmeans词聚类实现

package com.alg.qid.kmeans;import java.io.BufferedReader;import java.io.FileInputStream;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputStreamReader;import java.io.Outpu

2015-08-19 09:19:25 12217 1

原创 word2vec词向量模型裁剪简单demo

package com.zhubajie.alg.qid.segword;import java.io.BufferedInputStream;import java.io.BufferedOutputStream;import java.io.BufferedReader;import java.io.DataInputStream;import java.io.DataOutput

2015-08-14 09:31:09 1312

原创 Syntagmatic and Paradigmatic Relations 的代码调试

在研读ACL-2015的论文《Learning Word Representations by Jointly Modeling Syntagmatic and Paradigmatic Relations》的时候,被其清晰的理论推导吸引,正好其研究的领域与自己的工作相关,故想做试验尝试一下。作者提供了开源的代码:https://github.com/FeiSun/WordRep。但是由于Linu

2015-08-06 15:06:24 1122

原创 hive常用命令

1、拉去基本的数据并显示前100行2、带分隔符字符串连接3、查看部分表4、查看表结构5、导出简单的数据6、建表7、查看所有表

2015-06-30 21:33:30 384

原创 Linux下常用命令

1、查看所有的进程的2、文件合并3、查找4、运行脚本5、复制6、检查服务器文件系统磁盘占用情况7、新建脚本文件8、查看当前目录9、删除行10、查看行数11、上传下载文件12、创建文件夹13、运行jar包内存溢出时增加内存14、进入screen

2015-06-30 21:32:47 332

转载 RankNet——基本思想

1. RankNet的基本思想    RankNet方法就是使用交叉熵作为损失函数,学习出一些模型(例如神经网络、决策树等)来计算每个pair的排序得分,学习模型的过程可以使用梯度下降法。2. 方法流程    首先,我们要明确RankNet方法的目的就是要学习出一个模型,这个模型就是给文档算法的函数f(d, w)。其中d为文档特征,w为模型参数。    输入:que

2015-06-30 16:30:33 1002

原创 RankLib中的归并排序实现

Step one:public static int[] sort(double[] list, boolean asc) { int[] idx = new int[list.length]; for(int i=0;i<list.length;i++) idx[i] = i; return sort(list, idx, asc); }Step two

2015-06-30 10:18:32 481

转载 Solr-4.8.0入门配置说明

转载:http://jingyan.baidu.com/article/e8cdb32b5ae58f37052badad.htmlSolr-4.8.0入门配置说明工具/原料apache-tomcat-7.0.53(TOMCAT8方法相同)jdk-7u55-windows-x64solr-4.8.0WIN

2015-06-24 09:33:13 530

原创 SVM实现垃圾邮件分类(java调用libsvm.jar)

import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.IOException;import java.io.InputStreamReader;import libsvm.svm;import libsvm.svm_model;

2015-06-23 20:14:55 2417 2

原创 为什么myeclipse运行时run没错,而debug时却显示词表未被加载?

网上的观点:1、“多线程不能保证时序,debug只是在java vm加了些监控之类的,可能会导致线程切换调度的速度不一样!”目前尚未很好的解决,要么用run运行程序,要么在debug报错时,点击Resume(F8)继续跑吧。

2015-06-17 09:26:38 700

贝叶斯滤波与平滑 bayesian filtering and smoothing

描述了基于贝叶斯框架的滤波方法和平滑方法,用于得到精确的估计结果;该书涉及到了现在通用的一些滤波方法,模型构建更加数学化,使用MATLAB进行仿真。

2017-10-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除