大数据学习-Hadoop

大数据学习-Hadoop

1.大数据概念

  • 现状分析:实时计算
  • 原因分析:离线计算
  • 预测分析:机器学习(对未来趋势进行预测)

2.分布式与集群

  • 分布式:多台机器,不同组件

分布式存储,分布式集群,多台机器

  • 集群:多台机器,相同组件

3.Hadoop(卡大爷创建)

  • hadoop简介

image-20220809114238269

4.docker搭建hadoop集群

hadoop-cluster-docker

  • 1.Docker安装

  • 2.拉取hadoop集群镜像

  • 3.克隆仓库并修改start.sh中的开放端口文件

image-20220809154653136

  • 4.桥接网络 docker network ls

  • 5.运行容器并进入容器:docker exec -it hadoop-master bash

  • 6.启动hadoop:./start-hadoop.sh

  • 7.页面测试:本机127.0.01

  • HDFS集群:name node: [your ip address]:50070/ 浏览文件系统

image-20220809175008581

  • YARN集群:resource manager: [your ip address]:8088/ 监控集群资源:MapReduce,Sprark,Flink等 image-20220809174944226

  • 8.测试 word count:word count 是一个测试 hadoop 的 shell 脚本,即计算文本中的单词个数

  • docker进入hadoop容器命令

docker exec -it hadoop-master bash

  • Hadoop内部命令 :推荐全部使用 hadoop fs

创建文件夹命令:hdfs dfs -mkdir /hadoop

上传命令:hdfs dfs -put file.txt /hadoop/file.txt hdfs dfs -put file1.txt /hadoop/file1.txt

删除命令:hdfs dfs -rm -r /hadoop/file.text(可删除文件与文件夹)

查看文件夹命令:hadoop fs -ls /hadoop

查看文件内容:hdfs dfs -cat /hadoop/file.txt

  • Hadoop集群

一个大哥带几个小弟干活:hadoop-Master,hadoop-slave1,hadoop-sla

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值