- 博客(4)
- 收藏
- 关注
原创 基于hadoop2.6.0的hive-1.2.1安装
1.安装环境:有一个完全分布式的Hadoop-2.6.0。2.安装准备:需要在网上下一个Hive的压缩包,我这儿用的是apache-hive-1.2.1-bin.tar.gz。下载地址here3.将下载下来的hive压缩包解压,并更改用户权限。我的解压在/usr/localsudo tar -zxvf apache-hive-1.2.1-bin.tar.gz -C /usr/localsudo c
2017-03-31 10:09:31 1207
原创 基于hadoop-2.6.0的hbase完全分布式安装
1.安装环境:有一个完全分布式的hadoop-2.6.0。 2.安装准备:需要在网上下一个hbase的压缩包,我这儿用的是hbase-1.0.3-bin.tar.gz,下载地址here 3.解压下载好的hbase到一个目录下,并更改用户及用户组(我这儿用的是persistence用户启动hadoop和hbase的)。sudo tar -zxvf hbase-1.0.3-bin.tar.gz -C
2017-03-26 16:13:33 1345
原创 hadoop-chapter 2
一.namenode->可以看作是分布式文件系统中的管理者,主要负责管理文件系统的命名空间、集群配置信息和存储块的复制等1.管理文件系统文件的元数据信息(包括文件名称、大小、位置、属性、创建时间、修改时间等等)2.维护文件到块的对应关系和块到节点的对应关系3.维护用户对文件的操作信息(文件的增删改查)4.利用fsimage和edits对元数据进行管理二.datanode->是文件存储的基本单元,它将
2017-03-06 18:03:21 556
原创 hadoop - chapter 1
一.分布式1.分布式是指将不同的业务分布在不同的地方。 而集群指的是将几台服务器集中在一起,实现同一业务。2.分布式是以缩短单个任务的执行时间来提升效率的,而集群则是通过提高单位时间内执行的任务数来提升效率。二.cap理论C(Consistency一致性):所有的节点上的数据时刻保持同步A(Availability可用性):每个请求都能接受到一个响应,无论响应成功或失败P(Partition tol
2017-03-06 14:31:13 391
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人