云计算
文章平均质量分 60
zhumin726
这个作者很懒,什么都没留下…
展开
-
apache-hadoop 2.0.2-alpha HDFS Federation
原文出处http://hadoop.apache.org/docs/r2.0.2-alpha/hadoop-yarn/hadoop-yarn-site/Federation.htmlHDFSF分为2层 namespace和block storageNamespace 由目录,文件和快组成 支持所有的namespace 文件相关的操作,例如增,翻译 2012-10-17 13:49:46 · 1312 阅读 · 0 评论 -
hive简介,安装 配置常见问题和例子
<!--@font-face {font-family:Helvetica}@font-face {font-family:宋体}@font-face {font-family:"Cambria Math"}@font-face {font-family:Calibri}@font-face {font-family:"\@宋体"}p.MsoNormal原创 2012-09-28 11:08:37 · 6346 阅读 · 2 评论 -
chukwa安装
1 下载 wget http://mirror.bit.edu.cn/apache/incubator/chukwa/chukwa-0.5.0/chukwa-incubating-0.5.0.tar.gz2 解压 tar -zxvf chukwa-incubating-0.5.0.tar.gz3设置环境变量export CHUKWA_HOME=/home/hadoop/chukwa-i原创 2012-12-13 15:11:32 · 3224 阅读 · 0 评论 -
avro 1.7.3入门
1 maven中使用 org.apache.avro avro 1.7.3 org.apache.avro avro-maven-plugin 1.7.3 generate-sources schema ${原创 2013-01-05 10:56:30 · 2976 阅读 · 0 评论 -
mahout中的推荐 使用方法 解析
1 基本概念:user :用户item被推荐的项目或者内容2 推荐引擎分类2.1根据被推荐者分类:大众推荐引擎,个性化推荐引擎( 针对个人用户)2.2根据推荐原理:Demographic-based(通过用户的相关性) ,Content-based Recommendation(通过内容的相关性),协同过滤推荐2.2.1基于用户统计学,例如根据用户性别,年龄,地址等分类分成原创 2013-01-08 13:56:30 · 1763 阅读 · 0 评论 -
hadoop生产实践
hadoop生产实践1 机器选项,廉价机器,普通PC,普通硬盘。尽量不使用虚拟化(可用性,没必要)。 2 不同node不能共用一个物理硬盘,3 内存,namenode 32g datanode 4g4 cpu,内存较高的服务器作为datanode可以考虑虚拟机,需做cpu能力/内存 测试 .但是不同的虚拟节点依然不能共用同一个物理硬盘,防止IO冲突。5 用dns代替hosts,原创 2013-02-28 14:34:17 · 510 阅读 · 0 评论