- 博客(4)
- 收藏
- 关注
原创 Mahout的taste推荐系统里的几种Recommender分析
Taste简介Mahout 是apache下的一个java语言的开源大数据机器学习项目,与其他机器学习项目不同的是,它的算法多数是mapreduce方式写的,可以在hadoop上运行,并行化处理大规模数据。 协同过滤在mahout里是由一个叫taste的引擎提供的, 它提供两种模式,一种是以jar包形式嵌入到程序里在进程内运行,另外一种是MapReduce Job形式...
2012-12-28 17:30:37 189
原创 Mahout的taste里的几种相似度计算方法
欧几里德相似度(Euclidean Distance)最初用于计算欧几里德空间中两个点的距离,以两个用户x和y为例子,看成是n维空间的两个向量x和y, xi表示用户x对itemi的喜好值,yi表示用户y对itemi的喜好值,他们之前的欧几里德距离是对应的欧几里德相似度,一般采用以下公式进行转换:距离越小,相似度越大 在taste里,计算user之间和it...
2012-11-09 18:00:51 294
原创 Log4j AsyncAppender的buffersize属性的作用
当用log4j记录日志时,如果记录的日志量非常大,日志文件迅速增长,IO负载提高,会导致log的输出函数( 如log.info())等响应较慢。此时,我们就想把log的输出放到单独的线程中,这样调用端就可以快速返回,实现异步化。 log4j提供了一个AsyncAppender来实现日志的异步输出,AsyncAppender有一个buffersize属性,用于控制AsyncAppender的...
2011-12-27 15:50:23 1889
mongodb自增长(auto_increment)ID的实现方法
1. 为什么要手动实现自增长ID mongodb的Collection在插入数据时,如果没有指定'_id'字段,系统会自动产生一个'_id', 产生的规则类似UUID。由于这个ID的长度比较长,如果在一个Collection中存储大量数据时,会带来比较大的空间浪费。所以就由了自定义'_id'的需求,比如定义'_id'的类型为int。那么如何实现这个自定义id类似mysql的auto...
2011-12-26 17:40:11 1249
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人