随记

放弃可耻但是有用～

于 2019-12-28 14:32:30 发布

阅读量155

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44332962/article/details/103744026

版权

堆、栈、队列

堆是指程序在运行时，申请的内存，动态内存。

而栈是堆的一种使用方法（先进后出），也被称之为堆栈一种线性表：线性表指在一个数据结构有n个相同特性的数据元素。除去第一个和最后一个外首尾相接的有限序列（适合大部分线性表）。

队列也是一种特殊的线性表。不同于栈所服从的先进后出的原则，队列的原则是先进先出。

队列在队头做删除操作,在队尾做插入操作。

hadoop三种调度器

FIFO Scheduler（先进先出调度程序）不需要配置。如果为两个app调度资源，第一个app占用资源过大。第二个就需要等待第一个的完成。不适合共享集群

Capacity Scheduler（计算能力调度器）。用于一个集群中运行有多个Application的情况。目标是高吞吐量和集群利用率·为了防止一个job占过多的资源，调度器会对同一用户提交的job任务所占资源进行限制。

公平调度器（Fair Scheduler）。支持多个队列，每个队列可以配置一定的资源，每个队列中的job任务公平共享其所在队列的所有资源。

官网可看配置文档

http://hadoop.apache.org/docs/r2.7.2/hadoop-yarn/hadoop-yarn-site/CapacityScheduler.html

http://hadoop.apache.org/docs/r2.7.2/hadoop-yarn/hadoop-yarn-site/FairScheduler.html

上图是spark的生态系统，Shark是spark的类sql流语句。sparkStreaming是spark的流式分布式计算框架。Graphx是spark的图计算库MLBase是spark的机器学习库。

spark克服了MapReduce在迭代式计算和交互式计算方面的不足，引入RDD（Resilient Distributed Datasets）数据表示模型。RDD是一个有容错机制，可以被并行操作的数据集合，能够被缓存到内存或磁盘上。

放弃可耻但是有用～

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
随记

堆、栈、队列堆是指程序在运行时，申请的内存，动态内存。而栈是堆的一种使用方法（先进后出），也被称之为堆栈一种线性表：线性表指在一个数据结构有n个相同特性的数据元素。除去第一个和最后一个外首尾相接的有限序列（适合大部分线性表）。队列也是一种特殊的线性表。不同于栈所服从的先进后出的原则，队列的原则是先进先出。队列在队头做删除操作,在队尾做插入操作。hadoop三种调度器...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。