Hadoop 配置

Hadoop集群配置

配置hadoop之前,需要在hosts文件中添加主机名和ip地址的映射。例如:

master.hadoop    1.2.3.4

slaver1.hadoop    1.2.3.5

.......

/etc/profile中只需要JAVA_HOME的路径就可以了。没有必要设置HADOOP_HOME变量。否则会报warning,但并不影响运行。

  一、core-site.xml

 

<!--  fs.default.name - 这是一个描述集群中NameNode结点的URI(包括协议、主机名称、端口号),集群里面的每一台机器都需要知道NameNode的地址。DataNode结点会先在NameNode上注册,这样它们的数据才可以被使用。独立的客户端程序通过这个URI跟DataNode交互,以取得文件的块列表。-->
<property>
    <name>fs.default.name</name>
     <value>hdfs://localhost:54310</value>
</property>
       <!-- hadoop.tmp.dir 是hadoop文件系统依赖的基础配置,很多路径都依赖它。如果hdfs-site.xml中不配置namenode和datanode的存放位置,默认就放在这个路径中-->
<property>
      <name>hadoop.tmp.dir</name>
       <value>/home/hdfs/tmp</value>
</property>

二、hdfs-site.xml

 

<!-- dfs.replication -它决定着 系统里面的文件块的数据备份个数。对于一个实际的应用,它 应该被设为3(这个数字并没有上限,但更多的备份可能并没有作用,而且会占用更多的空间)。少于三个的备份,可能会影响到数据的可靠性(系统故障时,也许会造成数据丢失)-->
<property>
       <name>dfs.replication</name>
       <value>1</value>
 </property>
 三、mapred-site.xml
<!-- mapred.job.tracker -JobTracker的主机(或者IP)和端口。-->
<property>
       <name>mapred.job.tracker</name>
      <value>localhost:9001</value>
</property>

 四、master(仅需在namenode上配置)

master.hadoop

五、slavers(仅需在namenode上配置)

slaver1.hadoop

slaver2.hadoop

附:

一个对配置文件中各个属性的解释:http://blog.csdn.net/yangjl38/article/details/7583374

安装和配置document:http://www.hadooper.cn/dct/page/65672

转载于:https://www.cnblogs.com/jiama/archive/2013/03/18/2966660.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Hadoop是一个开源的分布式计算平台,可以用于处理大规模数据的存储和分析。Hadoop配置是非常重要的,以下是Hadoop配置的详细解释。 Hadoop配置主要包括两个方面:Hadoop的核心配置Hadoop的环境配置。核心配置指的是Hadoop的基本设置,包括Hadoop的文件系统、节点管理、任务调度等。环境配置则是指Hadoop运行所需要的环境变量和参数设置。 Hadoop的核心配置文件是hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml。hadoop-env.sh是Hadoop运行所需要的环境变量,例如JAVA_HOME和HADOOP_HOME等。core-site.xml是Hadoop的核心配置文件,其会设置Hadoop的文件系统类型、默认端口、用户访问权限等。hdfs-site.xml是Hadoop分布式文件系统(HDFS)的配置文件,其包括HDFS的副本数量、块大小、心跳间间隔等。mapred-site.xml和yarn-site.xml分别是Hadoop的MapReduce和YARN的配置文件,其包括任务调度方式、容器分配策略等。 除了核心配置文件外,还有一些辅助配置文件,用于设置Hadoop的日志、日志级别等。例如,log4j.properties用于配置Hadoop的日志记录行为,hadoop-metrics2.properties用于配置Hadoop的度量指标。 在配置Hadoop,还需要考虑网络拓扑、硬件资源、安全性等因素。可以通过配置rack awareness、tasktracker的数量、内存等来优化Hadoop的性能和可靠性。 总之,Hadoop配置详解涵盖了Hadoop的核心配置和环境配置。通过合理配置,可以使Hadoop运行在分布式集群上,有效地处理大规模数据的存储和分析任务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值