Mahout
张包峰
Distributed Computing
展开
-
Mahout数据承载
推荐数据的处理是大规模的,在集群环境下一次要处理的数据可能是数GB,所以Mahout针对推荐数据进行了优化。 Preference 在Mahout中,用户的喜好被抽象为一个Preference,包含了userId,itemId和偏好值(user对item的偏好)。Preference是一个接口,它有一个通用的实现是GenericPreference。 因为用户的喜好数据是大规原创 2012-11-16 22:07:32 · 2568 阅读 · 0 评论 -
(deprecated) 百度开放研究社区-hadoop云平台-mahout兴趣小组
百度开放研究云平台 百度开放研究云平台由百度开放研究计划支持而建设的。当前已建成基于开源Hadoop 1.0.0而构建的开放数据分析平台,将逐步投入数百台服务器来支持海量数据分析。同时也将不断在平台上放置来自百度产品和系统的数据供学术研究使用。来自学术界的使用者可以在该平台上开展数据分析的研究。 百度开放研究云平台是面向学术界免费使用的。有意使用者可以向campuscloud@baid原创 2012-11-10 20:55:46 · 5602 阅读 · 2 评论