自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Mahout的taste推荐系统里的几种Recommender分析

 Taste简介Mahout 是apache下的一个java语言的开源大数据机器学习项目,与其他机器学习项目不同的是,它的算法多数是mapreduce方式写的,可以在hadoop上运行,并行化处理大规模数据。 协同过滤在mahout里是由一个叫taste的引擎提供的, 它提供两种模式,一种是以jar包形式嵌入到程序里在进程内运行,另外一种是MapReduce Job形式...

2012-12-28 17:30:37 168

原创 Mahout的taste里的几种相似度计算方法

 欧几里德相似度(Euclidean Distance)最初用于计算欧几里德空间中两个点的距离,以两个用户x和y为例子,看成是n维空间的两个向量x和y,  xi表示用户x对itemi的喜好值,yi表示用户y对itemi的喜好值,他们之前的欧几里德距离是对应的欧几里德相似度,一般采用以下公式进行转换:距离越小,相似度越大 在taste里,计算user之间和it...

2012-11-09 18:00:51 261

原创 Log4j AsyncAppender的buffersize属性的作用

当用log4j记录日志时,如果记录的日志量非常大,日志文件迅速增长,IO负载提高,会导致log的输出函数( 如log.info())等响应较慢。此时,我们就想把log的输出放到单独的线程中,这样调用端就可以快速返回,实现异步化。 log4j提供了一个AsyncAppender来实现日志的异步输出,AsyncAppender有一个buffersize属性,用于控制AsyncAppender的...

2011-12-27 15:50:23 1792

mongodb自增长(auto_increment)ID的实现方法

1. 为什么要手动实现自增长ID       mongodb的Collection在插入数据时,如果没有指定'_id'字段,系统会自动产生一个'_id', 产生的规则类似UUID。由于这个ID的长度比较长,如果在一个Collection中存储大量数据时,会带来比较大的空间浪费。所以就由了自定义'_id'的需求,比如定义'_id'的类型为int。那么如何实现这个自定义id类似mysql的auto...

2011-12-26 17:40:11 1179

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除