锁屏面试题百日百刷-Spark篇(十四)

 锁屏面试题百日百刷,每个工作日坚持更新面试题。锁屏面试题app、小程序现已上线,官网地址:https://www.demosoftware.cn。已收录了每日更新的面试题的所有内容,还包含特色的解锁屏幕复习面试题、每日编程题目邮件推送等功能。让你在面试中先人一步!接下来的是今日的面试题:

1.Spark使用parquet文件存储格式能带来哪些好处?

1)如果说HDFS 是大数据时代分布式文件系统首选标准,那么parquet则是整个大数据时代文件存储格式实时首选标准。

2)速度更快:从使用spark sql操作普通文件CSV和parquet文件速度对比上看,绝大多数情况会比使用csv等普通文件速度提升10倍左右,在一些普通文件系统无法在spark上成功运行的情况下,使用parquet很多时候可以成功运行。

3)parquet的压缩技术非常稳定出色,在spark sql中对压缩技术的处理可能无法正常的完成工作(例如会导致lost task,lost executor)但是此时如果使用parquet就可以正常的完成。

4)极大的减少磁盘I/o,通常情况下能够减少75%的存储空间,由此可以极大的减少spark sql处理数据的时候的数据输入内容,尤其是在spark1.6x中有个下推过滤器在一些情况下可以极大的减少磁盘的IO和内存的占用,(下推过滤器)。

5)spark 1.6x parquet方式极大的提升了扫描的吞吐量,极大提高了数据的查找速度spark1.6和spark1.5x相比而言,提升了大约1倍的速度,在spark1.6X中,操作parquet时候cpu也进行了极大的优化,有效的降低了cpu消耗。

6)采用parquet可以极大的优化spark的调度和执行。我们测试spark如果用parquet可以有效的减少stage的执行消耗,同时可以优化执行路径。

2.Spark应用程序的执行过程是什么?

1)构建Spark Application的运行环境(启动SparkContext),SparkContext向资源管理器(可以是Standalone、Mesos或YARN)注册并申请运行Executor资源;

2)资源管理器分配Executor资源并启动StandaloneExecutorBackend,Executor运行情况将随着心跳发送到资源管理器上;

3)SparkContext构建成DAG图,将DAG图分解成Stage,并把Taskset发送给Task Scheduler。Executor向SparkContext申请Task,Task Scheduler将Task发放给Executor运行同时SparkContext将应用程序代码发放给Executor;

4)Task在Executor上运行,运行完毕释放所有资源。

3.如何理解Standalone模式下,Spark资源分配是粗粒度的?

spark默认情况下资源分配是粗粒度的,也就是说程序在提交时就分配好资源,后面执行的时候使用分配好的资源,除非资源出现了故障才会重新分配。比如Spark shell启动,已提交,一注册,哪怕没有任务,worker都会分配资源给executor。

4.FAIR调度模式的优点和缺点?

所有的任务拥有大致相当的优先级来共享集群资源,spark多以轮训的方式为任务分配资源,不管长任务还是端任务都可以获得资源,并且获得不错的响应时间,对于短任务,不会像FIFO那样等待较长时间了,通过参数spark.scheduler.mode 为FAIR指定。

5.请列举你碰到的CPU密集型的应用场景,你有做哪些优化?

1)CPU 密集型指的是系统的 硬盘/内存 效能 相对 CPU 的效能 要好很多,此时,系统运作,大部分的状况是 CPU Loading 100%,CPU 要读/写 I/O (硬盘/内存),I/O在很短的时间就可以完成,而 CPU 还有许多运算要处理,CPU Loading 很高。->cpu是瓶颈。

I/O 密集型指的是系统的CPU效能相对硬盘/内存的效能要好很多,此时,系统运作,大部分的状况是 CPU 在等 I/O (硬盘/内存) 的读/写,此时 CPU Loading 不高。->IO是瓶颈。

2)CPU密集型主要特点是要进行大量的计算,常见应用场景有:图计算、大量的逻辑判断程序,机器学习等,Mahout其实就是针对CPU密集的一个apache项目。

优化的点主要有,1)降低任务的并行执行,务越多,花在任务切换的时间就越多,CPU执行任务的效率就越低,2)优化计算逻辑,减少计算逻辑的复杂度,3)尽量减少使用高强度压缩方式,对原始数据的压缩和解压缩会增加CPU的负担

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 华为荣耀原线id平台工具包是为解决华为荣耀手机出现id而推出的一款工具包。在使用华为荣耀手机时,有时会出现id,这种情况下,你需要使用正确的工具才能解决这个问。 华为荣耀原线id平台工具包是华为品牌推出的一款专门针对id的工具包。它包含了一系列的工具和软件,能够帮助你使用最有效的方式来解决id。在使用该工具包之前,你需要确保你的手机已经成功地连接到计算机上,然后按照工具包的说明一步一步地进行操作。 使用该工具包可以在一定程度上帮助你减少手机维修的花费,让你能够更加方便快捷地解id。但是,需要注意的是,在使用该工具包之前,你需要仔细阅读说明,并且确认已经备份了重要的数据和文件,以免造成数据的丢失。 总之,华为荣耀原线id平台工具包是一款非常实用的解决id的工具,但使用者需要在正确认识工具的功能和使用前提下,按照说明正确操作,以免产生不必要的风险。 ### 回答2: 华为荣耀原线ID平台工具包是为了解决恢复华为荣耀手机的出厂设置而设计的。在使用这个工具包之前,首先需要确保手机已经开启了USB调试和OEM解功能,否则会出现无法使用的情况。 通过使用华为荣耀原线ID平台工具包,可以轻松地解决一些华为荣耀手机出现的问。例如,当手机出现无法正常启动、系统崩溃、忘记密码、无法进入系统等问时,可以使用这个工具包进行解决。它可以将手机恢复到出厂设置,同时解ID,让用户重新设置密码并重新使用手机。 同时,需要注意的是,使用这个工具包必须谨慎。因为要对手机进行解,需要进行一些操作,如果不小心操作不当可能会造成数据丢失,所以一定要备份好手机上的重要数据。此外,在使用工具包的时候,根据不同的手机型号,需要下载相应的机包和驱动程序,确保机的成功性。 总之,华为荣耀原线ID平台工具包对于华为荣耀手机的重要性不言而喻,但是在使用的时候必须谨慎。只有在懂得如何使用这个工具包的前提下,才能避免不必要的麻烦。 ### 回答3: 华为荣耀手机原线ID平台工具包,指的是用户可通过该工具包对自家的荣耀系列手机进行指定操作。具体而言,在一些特殊的使用场景下(例如忘记了ID或密码),该工具包能够帮助用户解决手机无法正常使用的问。 然而,需要注意的是,解ID需要一些特殊的前提条件和操作步骤,而操作不当有可能会导致手机出现各种问。所以,在使用该工具包前,用户需要具有相应的技术和操作经验,并严格按照软件的提示和操作手册步骤执行操作,以避免造成不必要的麻烦和损失。 总之,华为荣耀原线ID平台工具包是一个可以帮助用户解决荣耀手机的工具,但是需要用户具备一定的技术实力和操作经验。如果不确定自己的操作技巧,建议用户寻求专业的技术支持和服务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值