自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

OopsOutOfMemory盛利的博客

分布式计算||数据仓库||数据挖掘

  • 博客(7)
  • 收藏
  • 关注

原创 Spark机器学习库mllib之协同过滤

很久就想写一篇ML的实践文章,虽然看过肯多资料,总觉得纸上谈兵印象不深刻,过不了多久就忘了,现在就借Spark的Mllib来简单的实际一下推荐算法吧。      说起推荐算法,大家耳熟能详的就是CF(协同过滤),这次就拿CF中ALS(alternating least squares),交替最小二乘,来做个例子吧。CF里面的算法比较多,有基于物品的,基于用户的,ALS是基于矩阵分解的,关于

2014-06-25 18:01:33 11428 1

原创 Shark性能测试

Shark性能测试

2014-06-25 15:25:37 3862

原创 Hive中reduce个数设定

Hive中reduce个数设定原理解析

2014-06-24 14:46:30 13606 1

原创 About Me

角色名 : 盛利职业 : Hadoop研发,数据库开发 gongcheng

2014-06-23 18:47:17 2099

原创 推荐算法总结Recommendation

目前为止,推荐算法有好多种,比较常见的有协同过滤,但是其它的推荐算法zai

2014-06-23 17:12:40 7159

原创 Shark运维常见问题

Shark部署常见问题1、readObject can't find class org.apache.hadoop.hive.conf.HiveConforg.apache.spark.SparkException: Job aborted: Task 0.0:3 failed 4 times (most recent failure: Exception failure: java.l

2014-06-18 18:10:15 4918

原创 Shark集群搭建配置

Shark是基于Spark与Hive之上的一种SQL查询引擎,本文将带你搭建Shark集群

2014-06-17 18:05:37 4602

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除