自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (3)
  • 收藏
  • 关注

原创 流数据挖掘

流数据处理的限制:      1)分发速度非常快,必须及时处理,否则将永远丢失。2)即使分发速度较慢,同时多个数据流一起则超过了内存最大容量。   1.流数据抽样    问题描述:过去的一个月中典型用户提交的重复查询比率是多少。假设我们只存储其中十分之一的流元素    典型做法:对每个搜索查询产生一个随机数(比如0-9中间的一个随机数),并当且仅当为0时才存储。如果用户提交的查询足够多,

2013-10-14 23:00:41 1945

hadoop-2.5.2 和eclipse插件

hadoop eclipse插件

2015-10-22

文本相似度论文和网页查重

各种文本相似度论文,包含网页查重的论文。

2013-07-30

兼容lucene 3.5的paoding包

原本由 好山西人才在线 分享。自己亲身实验成功,不用SVN和ant

2013-06-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除