自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (8)
  • 收藏
  • 关注

原创 simhash

simhash在我看来,这个也不算简单啊,计算量仍然很大,尤其是我比较讨厌的是feature的庞大,对文本来说。吼吼。google在2002年的文章,Similarity Estimation Techniques from Rounding Algorithms。http://grunt1223.iteye.com/blog/964564http://www.cnbl

2013-08-12 17:08:38 1066

原创 hadoop

hadoop的使用记录,我在测试一部分数据,测试过程中,想ls出来看看,这样难免会修改job的outputformat,我在测一个工作任务,结果呢,我改了reducer的输出格式,也改了job的设置,可还是出错。开始不明白啊,我这个大粗人啊。今天看job的设置,突然看到了,里面有combine的设置,唉,一想combine是在reduce前,同时其输出也是reduce的输入,我明白

2013-08-12 15:56:33 720

原创 开机自动运行

单位主机经常换IP,VPN会时不时连不上的,IP地址也不能每天去人为看看,于是乎同事教一个简单的办法,写个脚本,每次开机时检查一次,然后把IP等信息发到一个服务器自己的帐户下,这样只要VPN能连上,就可以登录单位的主机了。这个简单,我会。ipcheck.sh!#/bin/shifconfig >ipcheck.txtscp ipcheck.txt

2013-08-01 14:40:22 848

KLINEMathematicalThoughtFromAncientToModernTimes3.pdf

Mathematical Thought from Ancient to Modern Times vol3

2019-07-21

my sql cookbook

my sql cookbook 2ed edition in chinese. please use it for study.

2019-01-16

dtw for time series data

dtw paper for time series data in big data. if you think it is useful please index it.

2019-01-16

Handbook of Statistics Vol 21

Handbook of Statistics Vol 21 - Stochastic Processes - Modeling and Simulation (Elsevier, 2003)

2018-12-26

pattern recognition, third edtion,PART3

Theodoridis S., Koutroumbas K. Pattern Recognition.3rd.ed.(AP, 2006)(840s) english edition

2009-04-08

pattern recognition,third edtion,PART2

Theodoridis S., Koutroumbas K. Pattern Recognition.3rd.ed.(AP, 2006)(840s) english edtion

2009-04-08

pattern recognition third edition,PART1

Theodoridis S., Koutroumbas K. Pattern Recognition.3rd.ed.(AP, 2006)(840s)

2009-04-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除