Spark机器学习库mllib之协同过滤

很久就想写一篇ML的实践文章,虽然看过肯多资料,总觉得纸上谈兵印象不深刻,过不了多久就忘了,现在就借Spark的Mllib来简单的实际一下推荐算法吧。       说起推荐算法,大家耳熟能详的就是CF(协同过滤),这次就拿CF中ALS(alternating least squares),交替最小二乘,来做个例子吧。 CF里面的算法比较多,有基于物品的,基于用户的,ALS是基于矩阵分解的,关于...
阅读(7866) 评论(2)

Shark性能测试

Shark性能测试...
阅读(2323) 评论(0)

Hive中reduce个数设定

Hive中reduce个数设定原理解析...
阅读(5118) 评论(1)

About Me

角色名 : 盛利 职业 : Hadoop研发,数据库开发 gongcheng...
阅读(1647) 评论(0)

推荐算法总结Recommendation

目前为止,推荐算法有好多种,比较常见的有协同过滤,但是其它的推荐算法zai...
阅读(3544) 评论(0)

Shark运维常见问题

Shark部署常见问题 1、readObject can't find class org.apache.hadoop.hive.conf.HiveConf org.apache.spark.SparkException: Job aborted: Task 0.0:3 failed 4 times (most recent failure: Exception failure: java.l...
阅读(3751) 评论(0)

Shark集群搭建配置

Shark是基于Spark与Hive之上的一种SQL查询引擎,本文将带你搭建Shark集群...
阅读(3225) 评论(0)
    个人资料
    • 访问:466557次
    • 积分:5151
    • 等级:
    • 排名:第5356名
    • 原创:80篇
    • 转载:0篇
    • 译文:1篇
    • 评论:67条
    博客专栏
    微博
    文章分类
    最新评论