hadoop
龙骨
这个作者很懒,什么都没留下…
展开
-
hadoop HA
前一篇文章介绍了Hadoop2.0(hadoop2.0架构,具体版本是hadoop2.2.0)的安装和最基本的配置(见http://www.linuxidc.com/Linux/2014-05/101173.htm ),并没有配置HA(High Avalability,高可用性),接下来的文章中会介绍hadoop2.0HA的配置。在介绍hadoop2.0的HA配置之前,本文先介绍hadoop2转载 2016-11-29 10:34:31 · 303 阅读 · 0 评论 -
HIVE与mysql的关系 hive常用命令整理 hive与hdfs整合过程
一、HIVE与mysql的关系 Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。Hive是Facebook 2008年8月刚开源的一个数据仓库框架,其系统目标与 Pig 有相似之处,但它有一些Pig目前还不支持的转载 2016-12-04 00:17:24 · 7321 阅读 · 0 评论 -
一头大象--Hadoop生态圈
一、简介 Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。简单地说来,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。图1 Hadoop主要项目 Common:一组分布式文件系统和通用I/O的组件与接口(序列化、Java RPC和转载 2016-12-04 01:10:54 · 1473 阅读 · 0 评论 -
hadoop SecondNamenode详解
SecondNamenode名字看起来很象是对第二个Namenode,要么与Namenode一样同时对外提供服务,要么相当于Namenode的HA。真正的了解了SecondNamenode以后,才发现事实并不是这样的。下面这段是Hadoop对SecondNamenode的准确定义:* The Secondary Namenode is a helper to the primary转载 2016-11-22 10:09:47 · 288 阅读 · 0 评论 -
Yarn的架构及原理
转自:http://www.cnblogs.com/codeOfLife/p/5492740.html1、YARN 是什么? 从业界使用分布式系统的变化趋势和 hadoop 框架的长远发展来看,MapReduce的 JobTracker/TaskTracker 机制需要大规模的调整来修复它在可扩展性,内存消耗,线程模型,可靠性和性能上的缺陷。在过去的几年中,hadoop 开发团队做了转载 2016-11-24 10:27:42 · 441 阅读 · 0 评论 -
zookeeper原理
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,它包含一个简单的原语集,分布式应用程序可以基于它实现同步服务,配置维护和命名服务等。Zookeeper是hadoop的一个子项目,其发展历程无需赘述。在分布式应用中,由于工程师不能很好地使用锁机制,以及基于消息的协调机制不适合在某些应用中使用,因此需要有一种可靠的、可扩展的、分布式的、可配置的协调机制来统一系统的状态。Zookee转载 2016-11-25 11:51:59 · 212 阅读 · 0 评论 -
HDFS(Hadoop Distributed File System )常用命令示例:
hadoop fs -mkdir /user/trunkhadoop fs -ls /userhadoop fs -lsr /user (递归的)hadoop fs -put test.txt /user/trunkhadoop fs -put test.txt . (复制到hdfs当前目录下,首先要创建当前目录)hadoop fs -get /user/trunk/test.tx转载 2016-11-25 13:45:56 · 606 阅读 · 0 评论 -
hadoop一些入门小知识点儿(命令)
外部eclipse连接hadoop1、把插件包放到eclipse的安装包plugins中(插件包:hadoop-eclipse-plugin-2.6.0)2、把haddop2.6.4的dll放到hadoop的安装包(hadoop的解压包)的bin目录下3、配置hadoop的环境变量--》HADOOP_HOMED:\Program Files\hadoop-2.6.5原创 2016-11-27 16:35:07 · 367 阅读 · 0 评论 -
StringTokenizer初步了解
在Hadoop里面经常看到有StringTokenizer,用来分割字符串。那么在这里就简单地了解一下这个类到底有什么用。 1. StringTokenizer(String str):构造一个用来解析str的StringTokenizer对象。 java默认的分隔符是“空格”、“制表符(‘\t’)”、“换行符(‘\n’)”、“回车符(‘\r’)”。2. StringT转载 2016-11-26 14:37:22 · 406 阅读 · 0 评论