hadoop
panchen666
沉舟侧畔千帆过,病树前头万木春
展开
-
初学HADOOP(MAPREDUCE-WORLD COUNT/HIVE/SQOOP)
MAPREDUCE-WORLD COUNTmapreduce-并行处理大数据集的框架 处理机制:JOBTRACKER-TASKTRACKER-JOB-MAP-REDUCE-OUTPUT主要思想:分而制之 #查看JAR信息hadoop jar hadoop-mapreduce-examples-2.7.1.jar#在HDFS新建目录 此目录虚拟?hadoop fs -mkdir /input原创 2017-08-11 17:07:14 · 435 阅读 · 0 评论 -
基于用户(user-based)的协同过滤推荐算法的初步理解以及代码实现
总论 协同过滤是目前最经典的推荐算法。 分而理之,协同,指通过在线数据找到用户可能喜欢的物品;过滤,滤掉一些不值得推荐的数据。 协同过滤推荐分为三种类型。第一种是基于用户(user-based)的协同过滤,第二种是基于项目(item-based)的协同过滤,第三种是基于模型(model based)的协同过滤。 我认为,选择哪种类型,取决于业务场景。需要考虑的是,use原创 2017-08-04 18:21:42 · 7695 阅读 · 0 评论