Hadoop常见错误解决

1. 通过命令和查看日志文件查看hadoop启动和运行情况

在NameNode端,可以通过

tail -100 /var/log/hadoop/hadoop/hadoop-hadoop-namenode-hadoop-namenode.log

查看NameNode的运行日志

 

在DataNode端也可以通过

cat /var/log/hadoop/hadoop/hadoop-hadoop-datanode-hadoop-datanode1.log

查看DataNode的运行日志。

 

通过jps命令分别在datanode和namenode端运行,查看已启动的服务。

 

2. NameNode不能启动:

Cannot lock storage ……tmp/dfs/name. The directory is already locked.

也许是因为执行hadoop的账号对这个文件夹tmp/dfs/name没有权限。可以使用如下命令解决

chown -R hadoop:hadoop /usr/hadoop

 

3. DataNode不能启动

在客户端日志显示 namenode namespaceID = 1713611278; datanode namespaceID = 596511341

这个问题基本上是因为在namenode端多次运行hadoop namenode –format 导致的。在hadoop的core-site.xml文件中(不同的hadoop版本名字会有不同)找到<name>hadoop.tmp.dir</name>,清空对应的文件夹。举例:

复制代码
[hadoop@hadoop-datanode1 hadoop]$ cat core-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
<!--global properties -->
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/hadoop/tmp</value>
</property>
复制代码

清空

[hadoop@hadoop-datanode1 tmp]$ rm -rf /usr/hadoop/tmp/*

然后重新启动hadoop,在datanode端用jps看是否datanode已经启动了。

 

4. 运行wordcount程序时fs找不到文件夹:

Input path does not exist: hdfs://localhost:9000/user/input

在集群环境中,处理的文件都是在hdfs中,所以必须把要处理的文件复制到hadoop 某个文件夹中。下面举例,在fs中新建文件夹,把提前做好的wordcount文件复制带hdfs中,最后运行程序。

[hadoop@hadoop-namenode ~]$ hadoop fs -mkdir /tmp/wordcount/input
[hadoop@hadoop-namenode ~]$ hadoop fs -put /home/hadoop/wordcount/input /tmp/wordcount/input
[hadoop@hadoop-namenode ~]$ hadoop fs -ls /tmp/wordcount/input

 hadoop jar /home/hadoop/hadoop-examples-1.1.2.jar wordcount /tmp/wordcount/input/input /tmp/wordcount/output

 

查看结果

hadoop fs -cat /tmp/wordcount/output/part-r-00000
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当使用Hadoop时,可能会遇到以下一些常见问题: 1. Hadoop集群的配置和部署:在构建Hadoop集群时,可能会遇到配置和部署问题,例如节点的添加、网络设置和安全性配置等。 2. 数据丢失或损坏:在数据处理过程中,可能会发生数据丢失或损坏的情况。这可能是由于硬件故障、网络问题或错误的数据处理操作引起的。 3. 任务调度和资源管理:Hadoop使用了YARN(Yet Another Resource Negotiator)来进行任务调度和资源管理。在配置和使用YARN时,可能会遇到问题,例如任务队列管理、资源限制和优先级等。 4. 性能调优:在处理大规模数据时,性能问题可能成为一个挑战。可能需要进行性能调优,例如调整数据块大小、优化数据压缩和并行度设置等。 5. 安全性和权限控制:Hadoop提供了一些安全性和权限控制机制,如Kerberos认证和访问控制列表(ACL)。在配置和使用这些机制时,可能会遇到问题,例如配置错误、权限不足或用户认证失败等。 6. 日志和故障排查:当Hadoop集群发生故障或出现错误时,查看日志文件是一种常见的排查方法。但是,理解和分析日志可能会具有挑战性,特别是在大规模集群和复杂的应用程序中。 这些是使用Hadoop常见的问题,但每个问题的具体解决方案可能会因环境和应用场景而异。为了解决这些问题,可以查阅Hadoop官方文档、在线论坛或咨询专业人士的意见。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值