之前疫情在家,参加了阿里云的在家云实践,白嫖了半年的云服务器,感觉体验还不错。最近推出有阿里云活动,1vCPU,2G内存的主机一年只要94,忍不住又冲了一波,用来装个完整的大数据环境。大致顺序如下:
- 安装
Java
- 安装
Hadoop 3.1.3
- 安装
Anaconda3
- 安装
Scala 2.11.12
- 安装
Spark 2.4.0
- 安装
sbt 0.13.11
- 安装
Kafka 0.10.2.0
主要参考林子雨老师的博客,剩下的HBase,Hive
啥的,以后有时间再慢慢配置。这里记录一下安装过程中出现的问题。
1、查看Hadoop版本报错
在Java
环境变量已经配置完成后,安装Hadoop 3.1.3
,查看版本时报错。
./bin/hadoop version ERROR: JAVA_HOME is not set and could not be found.
检查环境变量:
java -version java version "1.8.0_162" Java(TM) SE Runtime Environment (build 1.8.0_162-b12) Java HotSpot(TM) 64-Bit Server VM (build 25.162-b12, mixed mode) echo $JAVA_HOME /usr/lib/jvm/jdk1.8.0_162
都是正常的,但是Hadoop
还是无法找到Java
。查了一下还需要在../hadoop/etc/hadoop/hadoop-env.sh
中声明Java
的路径。
cd /usr/local/hadoop/etc/ vim hadoop-env.sh
在里面加上export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_162
,再次运行查看版本的命令就成功了。
./bin/hadoop version Hadoop 3.1.3 Source code repository https://gitbox.apache.org/repos/asf/hadoop.git -r ba631c436b806728f8ec2f54ab1e289526c90579 Compiled by ztang on 2019-09-12T02:47Z Compiled with protoc 2.5.0 From source with checksum ec785077c385118ac91aadde5ec9799 This command was run using /usr/local/hadoop/share/hadoop/common/hadoop-common-3.1.3.jar
2、启动Scala shell报错
安装完Scala,一启动就报错,淦!!!!!!!!!
./bin/scala Welcome to Scala 2.11.12 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_162). Type in expressions