大数据:分布式资源调度框架YARN,核心架构,主从结构,辅助结构,yarn和MapReduce部署与配置,蒙特卡罗法求圆周率PI

文章介绍了大数据领域的YARN框架,包括其核心架构、主从结构和辅助结构,以及如何部署和配置MapReduce与YARN。同时提到了在当前就业环境下,掌握数据库知识如Oracle和SQL的重要性,特别是对于寻求网络警察公务员职位的考生。此外,还讲解了使用蒙特卡罗算法求解圆周率PI的数据挖掘示例。
摘要由CSDN通过智能技术生成

大数据:分布式资源调度框架YARN,核心架构,主从结构,辅助结构,yarn和MapReduce部署与配置,蒙特卡罗法求圆周率PI

2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲 最最最重要的就是大数据,什么行测和面试都是小问题,最难最最重要的就是大数据技术相关的知识笔试


大数据:分布式资源调度框架YARN

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
yarn管理资源和调度
在调度过程中可以实现MapReduce

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
学校几万人,有教室就可以管了
调度就好办了
有效运行
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
集群中最好
在这里插入图片描述
集群大管家

在这里插入图片描述
分配资源,分散计算,汇总都靠yarn监管,分配

在这里插入图片描述
申请
在这里插入图片描述
yarn可以调度资源
剩下的别人用
在这里插入图片描述
三大组件,基本就OK了

存储,计算,资源调度。

yarn的架构,核心架构和辅助架构

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
一个存储,一个资源调度
各是各的
在这里插入图片描述
跟工厂一样
总的董事长resourcemanager

各个厂长nodemanager

在这里插入图片描述
懂事长总体安排
剩下的厂长各自安排即可

客户只需要问resourcemanager要资源即可
在这里插入图片描述
在这里插入图片描述
container容器
在这里插入图片描述
集装箱,一个个箱子
在这里插入图片描述去找集装箱就行
你不能多装
只能装这么多
RM关了一堆NM
在这里插入图片描述
还是主从管理结构
老大管整体
老二管单机

yarn的辅助架构

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
辅助提高安全性
在这里插入图片描述
给yarn提供安全保障就行

历史,记录
在这里插入图片描述
感觉就是辅助干活
在这里插入图片描述

隔离资源
在这里插入图片描述
在这里插入图片描述
干脆整一个统一记录日志的服务器
美滋滋
在这里插入图片描述
在这里插入图片描述
统一收集日志
美滋滋
舒服

这就是辅助架构
在这里插入图片描述
主从角色
辅助角色
在这里插入图片描述

MapReduce和yarn部署

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
部署,就是要启动主从辅助节点

MapReduce运行在yarn上的
不需要启动进程,只需要修改配置哦

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
为啥给node1上配置那么多内存
它承担的东西很多

在这里插入图片描述
各种配置MapReduce即可
在这里插入图片描述
yarn也要配置各种环境
在这里插入图片描述
配置resourcemanager和nodemanager
本地日志
历史服务器端口日志
代理服务器,安全
在这里插入图片描述
三台服务器都这样玩
在这里插入图片描述
hdfs那边也是这么玩的
yarn也是这么玩
–daemon

mapred是历史服务器的启动

在这里插入图片描述
在这里插入图片描述

hdfs是9870端口
8088是yarn集群的监控界面
在这里插入图片描述
init 0关机
在这里插入图片描述
MapReduce不需要单独启动进程哦

MapReduce和yarn初体验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
主从,辅助中的代理服务器
历史服务器需要单独启动
在这里插入图片描述
在这里插入图片描述

提交MapReduce任务去yarn执行

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
hive用的就是MapReduce

不需要写代码
spark和flink需要写代码
性能快
在这里插入图片描述
在这里插入图片描述
jar代表运行程序
程序代码在jar中
java类是我们要用程序中的wordcount类
输入文件
输出结果要不存在wc文件夹

在这里插入图片描述
在这里插入图片描述
结果
美滋滋

在这里插入图片描述
工作历史服务器
记录历史

在这里插入图片描述
map个数
样本数量
在这里插入图片描述
求pi
在这里插入图片描述

蒙特卡洛算法求pi

在这里插入图片描述
圆周率是一个比例,算的就是整个正方形的面积,乘比例
牛逼 了
在这里插入图片描述
在半圆内就是距离小于1就是内部
落到半圆内的点个数统计一波
就是圆周率/4

最后easy求出来了pi


总结

提示:重要经验:

1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

冰露可乐

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值