四五个月之前学习了hadoop,sparksql,在学习过程中遇到了许多问题,陆续地总结到了word文档中,现在把这些东西放到博客里,虽然都是些基础的问题,但是相信也能够帮助到和我一样刚刚入门的小伙伴们。
我的环境:CentOS 6.4 hadoop-2.6.0-cdh5.7.0 hive-1.1.0-cdh5.7.0 scala2.11.8 spark-2.1.0
1.maven依赖包下载慢
maven添加某些dependency时下载速度十分缓慢,这是由于下载地址在国外造成的。我们可以通过修改maven中的settings.xml文件,用阿里云的maven镜像替换掉原来的下载地址。具体操作如下:
删除掉文档中的中间部分,添加阿里云的镜像
<mirrors>
<mirror>
<id>nexus-aliyun</id>
<mirrorOf>*</mirrorOf>
<name>Nexus aliyun</name>
<url>
http://maven.aliyun.com/nexus/content/groups/public
</url>
</mirror>
</mirrors>
之后再添加dependency时速度那就是飞快了~
2.hadoop中datanode启动失败