1. 运行示例程序卡在:INFO mapreduce.Job: Running job: ..
此类问题网上多数是两种情况,/etc/hosts文件问题或者yarn-site.xml配置问题。
我遇到的是hosts内127.0.0.1 localhost导致的无法连接或者loop循环出现:
Retrying connect to server: localhost/127.0.0.1:36970..。所以我的例子里面 把hosts里localhost注掉了。
具体问题,要看hadoop/logs内的yarn-hadoop-resourcemanager-xxxx.log日志文件。根据文件查找原因。
2. 运行例子,抛出异常: Cannot create directory /user/hadoop/QuasiMonteC....... Name node is in safe mode.
该种情况网上给出的情况很多,但是最终我的解决是由于hadoop运行在安全模式下,退出安全模式就正常了。
hdfs dfsadmin -safemode leave
重新运行例子。
3. 查看Hadoop调试信息
在/etc/profile中增加:export HADOOP_ROOT_LOGGER=DEBUG,console
4. WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
开启debug,我的发现是缺少GLIBC_2.14,下载并安装即可。
wget http://ftp.gnu.org/gnu/glibc/glibc-2.14.tar.gz
tar -xzvf glibc-2.14.tar.gz
cd glibc-2.14
mkdir build
cd build
../configure --prefix=/opt/glibc-2.14
make -j4
make intall
5. ....SecondaryNameNode: Exception in doCheckpoint java.io.IOException: Inconsist...
hadoop-hadoop-secondaryNamenode-xxxx.log中出现....SecondaryNameNode: Exception in doCheckpoint java.io.IOException: Inconsist...
隔一段时间hadoop secondaryNamenode 会执行一次检查点操作,可以加速namenode启动,辅助namenode做一些工作,检查点满足的条件也是在xml里面配置的。hdfs-site.xml中参数dfs.namenode.checkpoint.period和dfs.namenode.checkpoint.txns来触发,满足一个就执行。
hdfs-site.xml增加:
<property>
<name>hadoop.tmp.dir</name>
<value>/mnt/hadoop/tmp</value>
</property>
删掉fs.checkpoint.dir 目录内容(如果未配置,默认在hadoop.tmp.dir文件夹内),重启即可。
期间出现过好多错误,由于新手,都是通过百度查询的,但是资料很多与自己错误不一样,五花八门,所以环境的搭建问题还是要多看日志,找到根源再找资料会快一些。有不对的,希望指正,阿弥陀佛。。。。