当前搜索:

Hadoop常见问题

原文地址:http://wiki.apache.org/hadoop/FAQ 1. General 1.1. What is Hadoop? Hadoop is a distributed computing platform written in Java. It incorpora...
阅读(297) 评论(0)

HDFS介绍

原文地址:http://www.cnblogs.com/forfuture1978/archive/2010/03/14/1685351.html 一、HDFS的基本概念 1.1、数据块(block) HDFS(Hadoop Distributed File System)默认的...
阅读(178) 评论(0)

HBase详细介绍

原文地址:http://blog.csdn.net/frankiewang008/article/details/41965543 1-HBase的安装 HBase是什么? HBase是Apache Hadoop中的一个子项目,Hbase依托于Hadoop的HDFS作为最基本...
阅读(553) 评论(0)

MapReduce原理与设计思想

原文地址:http://www.cnblogs.com/archimedes/p/mapreduce-principle.html 简单解释 MapReduce 算法 一个有趣的例子 你想数出一摞牌中有多少张黑桃。直观方式是一张一张检查并且数出有多少张是黑桃? ...
阅读(279) 评论(0)

Hadoop介绍

原文地址:http://cloud.csdn.net/a/20120220/312061.html 如今Apache Hadoop已成为大数据行业发展背后的驱动力。Hive和Pig等技术也经常被提到,但是他们都有什么功能,为什么会需要奇怪的名字(如Oozie,ZooKeeper、Fl...
阅读(217) 评论(0)

从Hadoop框架与MapReduce模式中谈海量数据处理

原文地址:http://zhipingch.iteye.com/blog/1629902 前言     几周前,当我最初听到,以致后来初次接触Hadoop与MapReduce这两个东西,我便稍显兴奋,觉得它们很是神秘,而神秘的东西常能勾起我的兴趣,在看过介绍它们的文章或论文之后...
阅读(361) 评论(0)

HDFS的运行原理

原文地址:http://www.weixuehao.com/archives/596 简介 HDFS(Hadoop Distributed File System )Hadoop分布式文件系统。是根据google发表的论文翻版的。论文为GFS(Google File System)Google ...
阅读(257) 评论(0)

大数据以及Hadoop相关概念介绍

原文地址:http://www.cnblogs.com/xdp-gacl/p/4230220.html 一、大数据的基本概念 1.1、什么是大数据   大数据指的就是要处理的数据是TB级别以上的数据。大数据是以TB级别起步的。在计算机当中,存放到硬盘上面的文件都会占用一定的存储空间,...
阅读(456) 评论(0)

HBase0.94和Hadoop2 结合

原文地址:https://hbase.apache.org/book.html 4.1.1. Apache HBase 0.94 with Hadoop 2 To get 0.94.x to run on Hadoop 2.2.0, you need to change the hadoop 2...
阅读(517) 评论(0)

Apache HBase配置介绍

原文地址:https://hbase.apache.org/book.html#_configuration_files Apache HBase Configuration This chapter expands upon the Getting Started chapter to fu...
阅读(312) 评论(0)

HBase常见问题及其答案

原文地址:http://www.cnblogs.com/panfeng412/archive/2012/09/08/hbase-faq-answer.html 1. HTable线程安全吗? HTable不是线程安全的,使用过程中建议一个线程中使用一个HTable对象,不同线程间不...
阅读(708) 评论(0)

什么时候用HBase

本文内容摘自官网:http://redis.io 63.2. When Should I Use HBase? HBase isn’t suitable for every problem. First, make sure you have enough data. If you h...
阅读(505) 评论(0)

Hbase原理、基本概念、基本架构

概述 HBase是一个构建在HDFS上的分布式列存储系统; HBase是基于Google BigTable模型开发的,典型的key/value系统; HBase是Apache Hadoop生态系统中的重要一员,主要用于海量结构化数据存储; 从逻辑上讲,HBase将数据按照表、行和列进行存储...
阅读(254) 评论(0)

MapReduce工作原理图文详解

MapReduce工作原理图文详解  MapReduce作业运行流程     流程分析: 1.在客户端启动一个作业。 2.向JobTracker请求一个Job ID。 3.将运行作业所需要的资源文件复制到HDFS上,包括MapReduce程序打包的JAR文件、配置文件和客户...
阅读(275) 评论(0)

Hadoop入门

Hadoop历史         雏形开始于2002年的Apache的Nutch,Nutch是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。         随后在2003年Google发表了一篇技术学术论文谷歌文件系统(GFS)。...
阅读(219) 评论(0)
    个人资料
    专栏达人 持之以恒
    等级:
    访问量: 163万+
    积分: 2万+
    排名: 466
    博客专栏