2014年06月_wuwei_it

06月 05月 04月 01月

原创 mahout的安装与配置

1.构建mahout要的系统事先安装 df

2014-06-12 11:17:08 630

原创伪分布式Hadoop配置安装

1. 安装Hadoop到/home/xsj/hadoop： $ tar -zxvf hadoop-0.20.2.tar.gz 2. 创建目录： $ mkdir /home/xsj/hadoop/hadoop-0.20.2/hadooptmp $ mkdir /home/xsj/hadoop/hadoop-0.20.2/hdfs/data $ mkdir /

2014-06-10 14:25:23 583

转载探索推荐引擎内部的秘密，第 3 部分: 深入推荐引擎相关算法 - 聚类

聚类分析什么是聚类分析？聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster)，它的目标是：在同一个簇中的对象之间具有较高的相似度，而不同簇中的对象差别较大。所以，在很多应用中，一个簇中的数据对象可以被作为一个整体来对待，从而减少计算量或者提高计算质量。其实聚类是一个人们日常生活的常见行为，即所谓“物以类聚，人以群分”，核心的思想也就是聚类。

2014-06-04 14:24:30 673

“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制，实现方法，其中还涉及一些基本的优化方法，例如聚类和分类的应用。同时在理论讲解的基础上，还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略，进行策略优化，构建高效的推荐引擎的方法。本文作为这个系列的第一篇文章，将深入介绍推荐引擎的工作原理，和其中涉及的各种推荐机制，以及它们各自的优缺点和适用场景，帮助

2014-06-04 14:19:13 523

转载用Maven构建Mahout项目

用Maven构建Mahout项目 Hadoop家族系列文章，主要介绍Hadoop家族产品，常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa，新增加的项目包括，YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop,

2014-06-03 12:24:50 702

徐皓+-+360大数据中心平台演进与实践.pdf

徐皓+-+360大数据中心平台演进与实践数据资产  全域产品数据分层、归一化全域产品数据分层、归一化  跨业务的数据价值评估体系跨业务的数据价值评估体系  统一的数据标准和安全体系统一的数据标准和安全体系  统一的用户账号体系  自助式创建用户标签  跨引擎的计算平台  图元化的任务配置  多数据源任务处理  基于场景化的服务

2020-02-25

常用网站列表

SQLite+Database+Browser

2011-11-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

wuwei_it的专栏

原创 mahout的安装与配置

原创伪分布式Hadoop配置安装

转载探索推荐引擎内部的秘密，第 3 部分: 深入推荐引擎相关算法 - 聚类

转载探索推荐引擎内部的秘密，第 1 部分: 推荐引擎初探

转载用Maven构建Mahout项目

徐皓+-+360大数据中心平台演进与实践.pdf

常用网站列表

空空如也

原创 mahout的安装与配置

原创 伪分布式Hadoop配置安装

转载 探索推荐引擎内部的秘密，第 3 部分: 深入推荐引擎相关算法 - 聚类

转载 探索推荐引擎内部的秘密，第 1 部分: 推荐引擎初探

转载 用Maven构建Mahout项目

徐皓+-+360大数据中心平台演进与实践.pdf

常用网站列表

空空如也

原创伪分布式Hadoop配置安装

转载探索推荐引擎内部的秘密，第 3 部分: 深入推荐引擎相关算法 - 聚类

转载探索推荐引擎内部的秘密，第 1 部分: 推荐引擎初探

转载用Maven构建Mahout项目