HDFS配置

转载 2015年09月07日 18:25:24
Hadoop的关键配置文件
     hdfs上传文件成功之后,自己又开始好奇地修改其配置文件。因为之前自己对于hadoop一直都是胡打乱撞,缺乏系统的理解和认识,在网上查到了一个篇hadoop配置文件的资料,于是就开始动起手来,不想出现了新的错误。首先来梳理下hadoop的配置文件:
1. hadoop-env.sh
     hadoop的运行环境配置,主要设置HADOOP_HOME和JAVA_HOME两个环境变量,指定其所在路径即可
2. core-site.xml
     注意fs.default.name属性要正确配置,该属性用于配置namenode节点,我们都知道一个hadoop系统中一般只有一个namenode节点管理所有的datanode,所以设置一定要正确:hdfs://localhost:8020。一般默认都是9000端口,但是我自己的ubuntu并不能正常运行,所以才修改为8020。8020端口是hadoop的namenode的RPC调用端口。
3. hdfs-site.xml
     dfs.replication属性,顾名思义表示指定的hadoop文件块的备份数量,一般默认是3份,可以设为1
     dfs.name.dir属性,非常重要,用来设置存放namenode数据的目录,如果这个目录访问失败,则会导致namenode启动失败
     dfs.data.dir属性,用来指定datanode上本地存放数据的目录,与namenode的设置独立没有关系
4. mapred-site.xml
     mapred.jop.tracker属性用来设置JobTracker的主机、IP地址和端口,本机的话可以设置为:localhost:9001
     Hbase系统的配置文件主要需要注意以下几个:
1. hbase-env.sh
     设置环境变量,要export Java路径,最后一行有个属性HBASE_MANAGES_ZK设为true表示启用自带的ZK,否则运行时会提示打开ZK错误,到时也可以使用apt-get单独的zookeeper运行。
2. hbase-site.xml
     hbase.rootdir属性设置region server的共享目录,默认写到tmp中,不改写的话重启后数据会丢失,我的设为了hdfs://localhost:8020/hbase

     zookeeper.znode.parent表示Hbase的跟ZNODE,一般默认为/hbase

 由于配置时经常需要修改文件,不晓得什么时候不小心就导致配置错误,因此经常备份是个好习惯,可以使用ubuntu的tar命令来实现备份,生成backup.tgz后放在/下:
tar  -cvpzf  backup.tgz   --exclude=/proc  --exclude=/backup.tgz  --exclude=/lost+found  --exclude=/mnt  --exclude=/sys  /
      恢复的时候可以使用命令:
tar -xvpzf  backup.tgz -C /

HDFS文件存放在实际的节点本地系统中,但是使用特殊的编码方式,有着自己的文件系统树结构,因此一般不能用cd命令进入查看。上传文件就是将自己的文件添加进HDFS的树中。

相关文章推荐

hadoop hdfs配置

  • 2017年03月23日 17:41
  • 65KB
  • 下载

hdfs高可用配置文件

  • 2015年07月06日 19:55
  • 2KB
  • 下载

【配置CDH和管理服务】关闭DataNode前HDFS的调优

配置CDH和管理服务 关闭DataNode前HDFS的调优 角色要求:配置员、集群管理员、完全管理员   当一个DataNode关闭,NameNode确保每一个DataNode中的每一个块根据...

【Flume】flume中sink到hdfs,文件系统频繁产生文件,文件滚动配置不起作用?

本人在测试hdfs的sink,发现sink端的文件滚动配置项起不到任何作用,配置如下: a1.sinks.k1.type=hdfs a1.sinks.k1.channel=c1 a1.sin...

为hdfs配置kerberos

  • 2014年10月27日 13:10
  • 103KB
  • 下载

Sqoop-1.4.6安装配置及Mysql->HDFS->Hive数据导入(基于Hadoop2.7.3)

写在前面本博客基于的环境如下: OS版本: Ubuntu16.04 Hadoop版本: Hadoop-2.7.3 Hbase版本: Hbase-1.3.1 Hive版本: Hive-2.1.1...

HDFS安装、配置以及基本使用

HDFS是一个分布式文件系统,安装完成之后使用起来类似于本地文件系统,但是它是一个网络文件系统,所以访问这种文件系统的方式和访问本地文件系统的方式还是有所差别的(本地文件系统的方式是基于系统调用的,当...

通过NFSv3挂载HDFS到本地目录 -- 1安装配置NFS

通过NFSv3挂载HDFS到本地目录  -- 1安装配置NFS 1. 背景 HDFS 几乎成了 分布式计算的标配, 但是,大部分的程序,或者程序袁使用的还是POSIX或者类POSIX接口。...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:HDFS配置
举报原因:
原因补充:

(最多只允许输入30个字)