Hadoop的详细配置(持续更新)

一、大数据(持续更新)

1. 前言

1.0作者感言

​ 我水平有限,大数据仍在学习中,但学习日志会不断更新,知识是个积累的过程,这个博客算是记录我学习的过程,而非盈利性的教程。如果你们有更好的办法或者意见,欢迎评论。

1.1选择Typora

​ 众所周知,计算机是一门过程性知识非常多的学科,我们需要一款工具来记录下我们的知识,Typora是一个非常好的选择,支持多种代码块,画面简约,编写方便,启动快速。

1.1.1 选择PicGo(APP)的原因

​ 由于我们的图片在本地,上传md文件到CSDN的时候,CSDN不支持本地相对路径上传图片,会提示失败,这是就需要一个网络中转站,先把我们的图片上传到这个中转站里面,那么我们的图片地址就成了一个网络地址,CSDN就会自动加载

1.1.2 下载PicGo并配置

​ 1. 偏好设置

image-20201221092607056
  1. 下载PicGo

    image-20201221092252129
  2. 这里注意不要选择带beta的版本,因为不稳定,容易崩溃

image-20201221092339773
  1. 我选择了
image-20201221092446324 image-20201221092507818
  1. 我们这里选择腾讯云COS,不选Github,因为Github服务器不在中国,所以会有下载上传缓慢的情况image-20201221093642930
  2. 创建对象存储桶(访问权限设置为 公开读私有写 ,提高安全性)

image-20201221094202723

存储桶名称对应“设置存储空间名”

所属地域对应“确认存储区域”

存储桶名称后面的一串数字对应“设定APPID”

  1. 最后授予PicGo密匙

    image-20201221094633318
  2. image-20201221094659399
  3. image-20201221094717295
  4. image-20201221094807895
1.1.3 开始写博客,记录自己学习的点点滴滴
1.1.4 附件下载地址

链接:https://pan.baidu.com/s/1oA1iDFWGUCYC6Sjk5OzVeQ
提取码:s8h9
复制这段内容后打开百度网盘手机App,操作更方便哦–来自百度网盘超级会员V1的分享

1.2 为什么用Linux?

众所周知,Linux最强的服务器操作系统,并且在一定程度上比windows安全。而大数据框架Hadoop也是运行在服务器之上,所以Linux是最优选。

2.下载VMware并安装Linux

注:附件在前言1.1.4

  1. image-20201221102000203

  2. image-20201221100351783
  3. image-20201221100404641
  4. image-20201221100426341
  5. image-20201221100442781
  6. image-20201221100623285
  7. image-20201221100633392
  8. 如果你的电脑是16G内存可以选择2GB,如果你的电脑是8G,则选择1G内存image-20201221100647760

  9. image-20201221100705383
  10. image-20201221100755639
  11. image-20201221100804995
  12. image-20201221100819952
  13. image-20201221100831213
  14. image-20201221100838090
  15. 完成image-20201221100846823

  16. image-20201221101243984
  17. image-20201221102346631
  18. 开启虚拟机image-20201221102045871

  19. 默认image-20201221102403420

  20. 跳过,选skipimage-20201221102451982

  21. image-20201221102538432
  22. image-20201221102612974
  23. image-20201221102643441
  24. image-20201221102659642
  25. image-20201221102720881
  26. image-20201221102813036
  27. image-20201221102829799
  28. image-20201221102855145
  29. image-20201221102914078
  30. image-20201221102938257
  31. image-20201221103007771
  32. 耐心等待image-20201221103047162

  33. 这里重启即可image-20201221104145766

  34. image-20201221104346153
  35. image-20201221104452815

3. 安装VMwareTools

VMwareTools可以让虚拟机和Windows10之间共享粘贴板

  1. image-20201221105044376

  2. 控制台输入以下两条指令

    cd /opt
    mkdir module software
    
  3. 解压到第3步创建的module文件夹中image-20201221105528514

  4. cd /opt/module/vmware-tools-distrib
    
    ./vmware-install.pl
    

    然后一路回车采用默认设置

  5. 这里不要着急,不要按ctrl+C,否则会中断,系统也会崩溃,耐心等待image-20201221110107983

  6. 这里同样不要着急,不要跳过或者关闭窗口image-20201221110323185

  7. 安装成功如图所示image-20201221110444480

  8. 重启即可生效

4.配置网络,确保能上网

4.1 vim /etc/sysconfig/network-scripts/ifcfg-eth0

如果你是选择了NAT,那么你的Linux配置好了就能上网,但是需要再配置/etc/sysconfig/network-scripts的ifcfg-eth0,以确保ssh远程登录成功

关键配置如下

BOOTPROTO=static
ONBOOT=yes

配置完成保存,重启即可生效

4.2 配置主机名与Ip的映射

vim /etc/hosts

输入ifconfig指令查询的ip地址

输入hostname指令查询的主机名

如图

image-20201221114826355

5. 配置SSH连接

终端输入以下指令查看ip地址

ifconfig

image-20201221112625964

此处端口号(port)不要改,否则会出错image-20201221112742510

选yes即可image-20201221112912066

6. 配置SSH免密登录

  1. 关闭防火墙

    chkconfig iptables off
    
  2. 终端输入

ssh-keygen -t rsa
  1. 回车image-20201221113419211

  2. 先用ssh登录一遍,这步目的是为了生成.ssh文件

    ssh localhost
    
image-20201221113533796
  1. 传递公钥

    ssh-copy-id machine110
    

    第一次会让你输入密码,第二次就不用了

  2. 成功之后如图

    image-20201221115514539

7. 配置hadoop和java环境变量

7.1卸载自带的Java

7.1.1检查自带的Java
7.1.1.1指令解析

rpm命令
-q  使用询问模式,当遇到任何问题时,rpm指令会先询问用户。
-a  查询所有套件。
grep命令用于查找文件里符合条件的字符串。

rpm -qa |grep java
rpm -qa |grep jdk
rpm -qa |grep gcj

如果没有输入提示信息表示没有安装

7.1.2卸载Java

方法一:批量卸载

rpm -qa | grep java | xargs rpm -e --nodeps

方法二:单个卸载

rpm -e 安装包的名字

7.2解压附件安装包

7.2.1解压指令解析

-z或–gzip或–ungzip 通过gzip指令处理备份文件。
-x或–extract或–get 从备份文件中还原文件。
-v或–verbose 显示指令执行过程。
-f<备份文件>或–file=<备份文件> 指定备份文件。
-C<目的目录>或–directory=<目的目录> 切换到指定的目录。

  1. image-20201221120041689
tar -zxvf hadoop-2.7.2.tar.gz -C /opt/module/
tar -zxvf jdk-8u144-linux-x64.tar.gz -C /opt/module/

7.3配置/etc/profile

  1. 终端输入
vim /etc/profile
  1. 按 “i” 进入编辑模式,加入以下代码
export JAVA_HOME=/opt/module/jdk1.8.0_144
export HADOOP_HOME=/opt/module/hadoop-2.7.2
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
  1. ESC退出编辑模式,按"wq"进行保存

  2. 重新加载配置文件

    source /etc/profile
    
  3. 检查是否配置正确

    java -version
    hadoop version
    

8.克隆虚拟机

8.1为什么要克隆虚拟机?

读者如果亲自配置过虚拟机,你会知道配置的过程是非常繁琐的,而且是非智力的劳动。在实际工作当中,你可能要配置3个节点以上,不可能一个一个配置,当你一个主机配置好后,选择克隆会省下很多功夫。

从安全方面上说,克隆可以防止数据丢失,相当于备份,以免系统崩溃又要从头再来的情况。

image-20201221133205969

附:更新在下一篇,欢迎读者移步我的主页查看

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

李南想做条咸鱼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值