分布式 大数据
文章平均质量分 73
IT爱好者菜鸟努力中
IT我的爱好,只恨这份热爱来得太晚
展开
-
浅析Hadoop的常用组件
Apache Hadoop 项目有两个核心组件,被称为 Hadoop 分布式文件系统 (Hadoop Distributed File System, HDFS) 的文件存储,以及被称为 MapReduce 的编程框架。有一些支持项目充分利用了 HDFS 和 MapReduce。HDFS: 如果您希望有 4000 多台电脑处理您的数据,那么最好将您的数据分发给 4000 多台电脑。HD转载 2016-07-04 14:51:51 · 308 阅读 · 0 评论 -
HBase二级索引
二级索引与索引Join是多数业务系统要求存储引擎提供的基本特性,RDBMS早已支持,NOSQL阵营也在摸索着符合自身特点的最佳解决方案。这篇文章会以HBase做为对象来讨论如何基于Hbase构建二级索引与实现索引join。文末同时会列出目前已知的包括0.19.3版secondary index, ITHbase, Facebook方案和官方Coprocessor的介绍。理论目标在HBa转载 2016-07-05 10:16:03 · 594 阅读 · 0 评论 -
The way of enabling HDFS HA by using Cloudera-manager
Enabling HDFS HA Using Cloudera ManagerMinimum Required Role: Cluster Administrator (also provided by Full Administrator)You can use Cloudera Manager to configure your CDH 4 or CDH 5 cluster f转载 2016-11-24 11:47:29 · 637 阅读 · 0 评论