自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (2)
  • 收藏
  • 关注

原创 mahout的安装与配置

1.构建mahout要的系统事先安装 df

2014-06-12 11:17:08 630

原创 伪分布式Hadoop配置安装

1. 安装Hadoop到/home/xsj/hadoop: $ tar -zxvf hadoop-0.20.2.tar.gz 2. 创建目录: $ mkdir /home/xsj/hadoop/hadoop-0.20.2/hadooptmp $ mkdir /home/xsj/hadoop/hadoop-0.20.2/hdfs/data $ mkdir /

2014-06-10 14:25:23 583

转载 探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类

聚类分析 什么是聚类分析? 聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对待,从而减少计算量或者提高计算质量。 其实聚类是一个人们日常生活的常见行为,即所谓“物以类聚,人以群分”,核心的思想也就是聚类。

2014-06-04 14:24:30 673

转载 探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探

“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一篇文章,将深入介绍推荐引擎的工作原理,和其中涉及的各种推荐机制,以及它们各自的优缺点和适用场景,帮助

2014-06-04 14:19:13 523

转载 用Maven构建Mahout项目

用Maven构建Mahout项目 Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop,

2014-06-03 12:24:50 702

徐皓+-+360大数据中心平台演进与实践.pdf

徐皓+-+360大数据中心平台演进与实践 数据资产  全域产品数据分层、归一化 全域产品数据分层、归一化  跨业务的数据价值评估体系 跨业务的数据价值评估体系  统一的数据标准和安全体系 统一的数据标准和安全体系  统一的用户账号体系  自助式创建用户标签  跨引擎的计算平台  图元化的任务配置  多数据源任务处理  基于场景化的服务

2020-02-25

常用网站列表

SQLite+Database+Browser

2011-11-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除