Ubuntu:Spark安装

最新推荐文章于 2023-04-17 12:31:28 发布

ShellDawn

最新推荐文章于 2023-04-17 12:31:28 发布

阅读量757

点赞数

分类专栏： spark 文章标签： ubuntu spark

本文链接：https://blog.csdn.net/ShellDawn/article/details/79129842

版权

spark 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

创建hadoop用户：

sudo user add -m Hadoop -s /bin/bash
sudo passed hadoop
sudo adduser Hadoop sudo

登陆hadoop用户

sudo apt-get update
sudo apt-get install vim
sudo apt-get install openssh-server
ssh localhost
exit
cd ~/.ssh/
ssh-keygen -t rsa
cat ./id_rsa.pub >> ./authorized_keys

安装java环境

sudo apt-get install openjdk-8-jre openjdk-8-jdk
vim ~/.bashrc

文件最后添加路径

export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64

是文件生效

source ~/.bashrc

安装hadoop2
选择stable文件夹下不带src的tar包
下载链接
http://mirror.bit.edu.cn/apache/hadoop/common/或者
http://mirrors.cnnic.cn/apache/hadoop/common/

sudo tar -zxvf ~/Downloads/hadoop-2.9.0.tar.gz -C /usr/local
cd /usr/local/
sudo mv ./hadoop-2.6.0/ ./hadoop
sudo chown -R Hadoop ./hadoop
cd /usr/local/hadoop
./bin/hadoop version

到此已经安装完成

Hadoop单机配置

cd /usr/local/hadoop
mkdir ./input
cp ./etc/hadoop/*.xml ./input
./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep ./input ./output 'dfs[a-z.]+'
cat ./output/*
rm -r ./output

hadoop伪分布式配置
修改/usr/local/hadoop/etc/hadoop/core-site.xml

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/usr/local/hadoop/tmp</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

修改/usr/local/hadoop/etc/hadoop/hdfs-site.xml

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/data</value>
    </property>
</configuration>

执行NameNode初始化

./bin/hdfs namenode -format
./sbin/start-dfs.sh

成功启动后，可以Web访问http://localhost:50070
运行伪分布式实例

./bin/hdfs dfs -mkdir -p /user/hadoop
./bin/hdfs dfs -put ./etc/hadoop/*.xml input
./bin/hdfs dfs -ls input
./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep input output 'dfs[a-z.]+'
./bin/hdfs dfs -cat output/*
rm -r ./output
./bin/hdfs dfs -get output ./output
cat ./output/*
./bin/hdfs dfs -rm -r output
./sbin/stop-dfs.sh

ShellDawn

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Ubuntu:Spark安装

创建hadoop用户：sudo user add -m Hadoop -s /bin/bashsudo passed hadoopsudo adduser Hadoop sudo登陆hadoop用户sudo apt-get updatesudo apt-get install vimsudo apt-get install openssh-serverssh lo
复制链接

扫一扫