云计算题库

最新推荐文章于 2024-08-13 11:38:54 发布

Linda .

最新推荐文章于 2024-08-13 11:38:54 发布

阅读量5.7k

点赞数 1

文章标签：云计算 scala hadoop

本文链接：https://blog.csdn.net/Alex_wanwan/article/details/124732081

版权

1.下列关于云存储的描述不正确的是 ( )
A. 可以将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作。
B. 需要通过集群应用、网格技术或分布式文件系统等技术实现
C. 云存储通过服务的形式提供给用户使用
D. “云存储对于使用者来讲是透明的”,也就是说使用者清楚存储设备的品牌,型号的具体细节
答案: D
2.下面哪个操作肯定是宽依赖
A. flatMap
B. sample
C. map
D. reduceByKey
答案:D
3.mapreduce的样例放在哪个目录中
A. sbin
B. share
C. etc
D. bin
答案:B
4.除非特别指定,cp假定要拷贝的文件在下面哪个目录下( )
A. root目录
B. 用户目录
C. home目录
D. 当前目录
答案:D
5.Scala关于变量定义、赋值,错误的是?
A. var b = “Hello World!” ; b = “123”
B. val a = 3
C. var b:Int = 3 ; b = 6
D. val a:String = 3
答案:D
6.从研究现状上看,下面不属于云计算特点的是( )
A. 高可靠性
B. 虚拟化
C. 超大规模
D. 私有化
答案:D
7 .下列哪个程序通常与 NameNode 在一个节点启动?答案
A. Jobtracker
B. TaskTracker
C. SecondaryNameNode
D. DataNode
答案:A
8.下列哪项通常是Hadoop集群的最主要瓶颈
A. 磁盘
B. 网络
C. CPU
D. 内存
答案:A
9 .scala中的类,下面说法正确的是?
A. scala 中,使用extends进行类的扩展。
B. scala中,超类必须是抽象类。
C. scala 中, 声明为final的类可以被继承。
D. scala中,抽象类可以被实例化。
答案:A
10 .下面与HDFS类似的框架是
A. EXT3
B. NTFS
C. FAT32
D. GFS
答案:D
11. 哪个目录存放用户密码信息( )
A. /boot
B. /var
C. /dev
D. /etc
答案:D
12. 以下关于特质的说法错误的是?
A. 特质可以要求实现它们的类具备特定的字段、方法或超类。
B. 与Java接口(Interface)相同,Scala特质也可以提供方法和字段的实现。
C. 类可以实现任意数量的特质。
D. 当将多个特质叠加在一起时,顺序很重要–其方法先被执行的特质排在更后面。
答案:B
13. HDFS的NameNode负责管理文件系统的命名空间,将所有的文件和文件夹的元数据保存在一个文件系统树中,这些信息也会在硬盘上保存成以下文件:
A. 日志
B. 两者都是
C. 命名空间镜像
答案:B
14.以下说法不正确的是
A. 采用脚本语言时必须遵从UNIX的标准输入STDIN,并输出到STDOUT
B. Hadoop Streaming使用Unix中的流与程序交互
C. Hadoop Streaming允许我们使用任何可执行脚本语言处理数据流
D. Reduce没有设定,上述命令运行会出现问题
答案:D
15.Hadoop 配置文件所在目录是
A. bin
B. share
C. etc
D. sbin
答案:C
16.关于虚拟化的描述,不正确的是 ( )
A. 虚拟化技术不能将多个物理服务器虚拟成一个服务器
B. 虚拟化技术可以扩展硬件的容量,简化软件的重新配置过程。
C. CPU的虚拟化技术可以单CPU模拟多CPU运行,允许一个平台同时运行多个操作系统。
D. 虚拟化是指计算机元件在虚拟的基础上而不是真实的基础上运行。
答案:A
17.下列哪项通常是集群的最主要瓶颈
A. CPU
B. 磁盘IO
C. 内存
D. 网络
答案:B
18.关于 SecondaryNameNode 哪项是正确的?
A. SecondaryNameNode 应与 NameNode 部署到一个节点。
B. 它对内存没有要求
C. 它是 NameNode 的热备
D. 它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间
答案:D
19.关于云管理平台描述错误的是( )
A. 为应用提供安全、高性能、可扩展、可管理、可靠和可伸缩的全面保障
B. 云管理平台为业务系统提供灵活的部署、运行与管理环境
C. 屏蔽底层硬件,操作系统的差异
D. 云管理不涉及到虚拟资源的管理
答案:D
20.类和单例对象间的差别是?
A. 单例对象不可以带参数,而类可以
B. 单例对象不可以定义私有属性,而类可以
C. 单例对象不可以继承,而类可以
D. 单例对象不可以定义方法,而类可以
答案:A
21.Hadoop的作者是下面哪一位
A. Kent Beck
B. Martin Fowler
C. Grace Hopper
D. Doug cutting
答案:D
22.以下单例对象,定义错误的是?
A. object A{def str = “”}
B. object A{val str = “”}
C. object A{var str = “”}。
D. object A(str:String){}
答案:D
23.对于Map(“book” ->; 5, “pen” ->; 2).map(m =>; m.1 ->; m.2 * 2)结果说法正确的是?
A. Map(“bookbook” ->; 10, “penpen” ->; 4)
B. Map(“book” ->; 10, “pen” ->; 4)
C. Map(“bookbook” ->; 5, “penpen” ->; 2)
D. Map(“book” ->; 5, “pen” ->; 2 ,“book” ->; 5, “pen” ->; 2)
答案:B
24.下面哪个操作是窄依赖
A. filter
B. join
C. group
D. sort
答案:A
25.Task 运行在下来哪里个选项中 Executor 上的工作单元
A. Cluster manager
B. worker node
C. Driver program
D. spark master
答案:B
26.【判断】 “云”计算服务可信性依赖于计算平台的安全性。( )
A. 错误
B. 正确
答案:A
27.【判断】云计算产业链中的“造云者”角色是云服务提供商( )
A. 正确
B. 错误
答案:B
28.下列哪个程序通常与 NameNode 在同一个节点启动
A. TaskTracker
B. SecondaryNameNode
C. Jobtracker
D. DataNode
答案:C
29.若要将鼠标从VM中释放出来,可按 ( )键来实现
A. Ctrl + Alt
B. Ctrl +Alt +Enter
C. Ctrl +Alt +Del
D. Ctrl +Enter
答案:A
30.spark执行流程中将RDD Graph转化为stage的有向无环图是
A. Executor
B. DAGScheduler
C. Driver
D. TaskScheduler
答案:B
31.Spark 支持的分布式部署方式中哪个是错误的
A. spark on YARN
B. spark on mesos
C. Spark on local
D. standalone
答案:C
32.如果需要使用scala库中的sqrt函数,如sqrt(2),下列引用包的方式错误的是?
A. import math.sqrt
B. import sqrt
C. import scala.math.
D. import math.
答案:B
33. 在vim编辑器里,命令"dd"用来删除当前的( )
A. 行
B. 字
C. 字符
D. 变量
答案:A
34.关于辅助构造器,以下说法不正确的是?
A. 辅助构造器可以有任意多个
B. 辅助构造器必须要带参数
C. 辅助构造器的定义要调用已定义的辅助构造器或主构造器。
D. 辅助构造器的名称为this。
答案:B
35.配置secondnamenode所在服务器的配置文件是
A. mapred-site.xml
B. slave
C. hdfs-site.xml
D. core-site.xml
答案:C
36.以下四个Hadoop预定义的Mapper实现类的描述错误的是
A. RegexMapper;实现Mapper<K, Text, Text, LongWritable>;,为每个常规表达式的匹配项生成一个(match, 1)对
B. TokenCountMapper;实现Mapper<K, Text, Text, LongWritable>;,当输入的值为分词时,生成(taken, 1)对
C. IdentityMapper<K, V>;实现Mapper<K, V, K, V>;,将输入直接映射到输出
D. InverseMapper<K, V>;实现Mapper<K, V, K, V>;,反转键/值对
答案:D
37.关于 SecondaryNameNode 下面哪项是正确的( )。
A. 它对内存没有要求
B. 它是 NameNode 的热备
C. SecondaryNameNode 应与 NameNode 部署到一个节点
D. 它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间
答案:D
38.rdd执行流程中负责申请资源的是
A. TaskScheduler
B. Driver
C. Executor
D. DAGScheduler
答案:B
39.Hadoop fs中的-get和-put命令操作对象是
A. 两者都是
B. 目录
C. 文件
答案:A
40.Client 端上传文件的时候下列哪项正确
A. 数据经过 NameNode 传递给 DataNode
B. Client 端将文件切分为 Block，依次上传
C. Client 只上传数据到一台 DataNode，然后由 NameNode 负责 Block 复制工作
答案:B
41.类定义如下,描述不正确的是?abstract class Element{def contents: Array[String]}
A. Element不能实例化。
B. Element是一个抽象类。
C. Contents成员定义错误,没有初始化。
D. contents方法是类Element的抽象成员。
答案:C
42.下面哪个不是 RDD 的特点
A. 可持久化
B. 可序列化
C. 可修改
D. 可分区
答案:C
43.下面哪个程序负责 HDFS 数据存储。
A. secondaryNameNode
B. Datanode
C. NameNode
D. Jobtracker
E. tasktracker
答案:B
44.Worker是________
A. 上下文
B. 执行器
C. 主节点
D. 从节点
答案:D
45.在Scala中如何获取字符串“Hello”的首字符和尾字符?
A. “Hello”(0),“Hello”(5)
B. “Hello”.take(1),“Hello”.reverse(0)
C. “Hello”.take(0), “Hello”.takeRight(1)
D. “Hello”(1),“Hello”(5)
答案:B
46.【判断】存储虚拟化的原理是利用高性能存储平台做为一级存储,其它存储做为二级存储,统一构建一个存储池,其内部数据可以自由“流动”,前端业务不感知( )
A. 正确
B. 错误
答案:A
47.DataFrame 和 RDD 最大的区别
A. 科学统计支持
B. 存储方式不一样
C. 多了 schema
D. 外部数据源支持
答案:C
48.Executor是_________
A. 从节点
B. 主节点
C. 执行器
D. 上下文
答案:C
49.配置hadoop文件数据所在目录的配置文件是
A. hdfs-site.xml
B. core-site.xml
C. mapred-site.xml
D. slave
答案:B
50.HDFS 默认 Block Size的大小是
A. 64MB
B. 128MB
C. 32MB
D. 256M
答案:A
51.SparkContext是________
A. 主节点
B. 上下文
C. 执行器
D. 从节点
答案:B
52.Secondary namenode就是namenode出现问题时的备用节点
A. 错误
B. 正确
答案:A
53.关于HDFS的文件写入,正确的是
A. 默认将文件块复制成三份存放
B. 用户可以在文件任意位置进行修改
C. 支持多用户对同一文件的写操作
D. 复制的文件块默认都存在同一机架上
答案:A
54.高阶函数是指?
A. 函数参数为函数或返回结果为函数的函数。
B. 执行时间长的函数。
C. 在程序中应该首先被定义的函数。
D. 将函数作为参数,并返回结果为函数的函数。
答案:A
55.将平台作为服务的云计算服务类型是( )
A. 三个选项都不是
B. PaaS
C. SaaS
D. IaaS
答案:B
56.关于Hadoop单机模式和伪分布式模式的说法,正确的是
A. 两者都不与守护进程交互,避免复杂性
B. 单机模式不使用HDFS,但加载守护进程
C. 两者都起守护进程,且守护进程运行在一台机器上
D. 后者比前者增加了HDFS输入输出以及可检查内存使用情况
答案:D
57.以下关于Scala中函数的描述错误的是?
A. 函数是“头等公民”,就和数字一样。
B. 可以将函数作为参数,传递给其它函数。
C. 支持非具名函数,也即匿名函数。
D. 可以将函数赋值给变量,如val fun = scala.math.ceil。
答案:D
58.哪个命令可以将普通用户转换成超级用户( )
A. passwd
B. su
C. super
D. tar
答案:B
59.Hadoop 作者 ( )
A. Doug cutting
B. Kent Beck
C. Martin Fowler
答案:A
60.按下键能终止当前运行的命令 ( )
A. Ctrl-D
B. Ctrl-C
C. Ctrl-F
D. Ctrl-B
答案:B
61.修改HDFS保存文件数量的配置文件为
A. hdfs-site.xml
B. slave
C. mapred-site.xml
D. core-site.xml
答案:A
62.云计算是对( )技术的发展与运用;
A. 三个选项都是;
B. 分布式计算
C. 网格计算
D. 并行计算
答案:A
63.spark是hadoop生态下哪个组件的替代方案
A. Hadoop
B. Yarn
C. HDFS
D. MapReduce
答案:D
64.HDFS 默认 Block Size 答案:
A. 64MB
B. 32MB
C. 128MB
答案:A
65.若要使用进程名来结束进程,应使用( )命令。
A. pss
B. pstree
C. ps
D. kill
答案:D
66.关于函数def sum(args:Int*) = {var r = 0 ; for(arg <- args) r += arg ; r}} 输出结果不一致的是?
A. sum(2,4)
B. sum(1,2,3)
C. sum(6)
D. sum(1,1,1,2)
答案:D
67.默认情况下管理员创建了一个用户,就会在( )目录下创建一个用户主目录。
A. /etc
B. /root
C. /home
D. /usr
答案:C
68.大数据的特点不包括下面哪一项
A. 巨大的数据量
B. 价值密度高
C. 多结构化数据
D. 增长速度快
答案:B
69.关于和Scala进行交互的基本方式REPL说法错误的是?
A. P 解析(Parse)
B. L 循环(Loop)
C. R 读取(read)
D. E 求值(evaluate)
答案:A
70.集合可以分为三大类,以下描述中不是这三大类的是?
A. 序列(Seq)
B. 集(Set)
C. 列表(List)
D. 映射(Map)
答案:C
71.用于文件系统直接修改文件权限管理命令为:( )
A. chgrp
B. chmod
C. chown
D. umask
答案:B
72.ClusterManager是________
A. 主节点
B. 从节点
C. 上下文
D. 执行器
答案:A
73.将基础设施作为服务的云计算服务类型是IaaS,其中的基础设施不包括( )
A. 应用程序
B. CPU资源
C. 网络资源
D. 内存资源
E. 存储资源
答案:A
74.在Linux中,一般用( )命令来查看网络接口的状态
A. ping
B. ipconfig
C. ifconfig
D. winipcfg
答案:C
75.k-Means算法中的k表示_________
A. 最近数据点个数
B. 距离参数
C. 簇的个数
D. 模型迭代次数
答案:C
76.Doug Cutting所创立的项目的名称都受到其家人的启发,以下项目不是由他创立的项目是
A. Solr
B. Nutch
C. Lucene
D. Hadoop
答案:A
77.配置resourcemanager所在服务器地址的文件
A. core-site.xml
B. slave
C. yarn-site.xml
D. hdfs-site.xml
答案:C
78.在Linux中,系统默认的( )用户对整个系统拥有完全的控制权。
A. root
B. guest
C. administrator
D. supervistor.
答案:A
79.下列关于MapReduce说法不正确的是
A. MapReduce隐藏了并行计算的细节,方便使用
B. MapReduce来源于google的学术论文
C. MapReduce是一种计算框架
D. MapReduce程序只能用java语言编写
答案:D
80.spark 的四大组件下面哪个不是
A. Mlib
B. Spark R
C. Spark Streaming
D. Graphx
答案:B
81.下列哪个不是 RDD 的缓存方法
A. persist()
B. Memory()
C. Cache()
答案:B
82.【判断】随着云计算的发展和推动,云桌面一定会代替传统本地桌面。( )
A. 正确
B. 错误
答案:B
83.【判断】互联网就是一个超大云。( )
A. 错误
B. 正确
答案:A
84.( )与SaaS不同的,这种“云”计算形式把开发环境或者运行平台也作为一种服务给用户提供。
A. 基于WEB服务
B. 基于平台服务
C. 基于管理服务
D. 软件即服务
答案:B
85.关于 SecondaryNameNode 哪项是正确的？
A. 它对内存没有要求
B. 它是 NameNode 的热备
C. 它的目的是帮助 NameNode 合并编辑日志，减少 NameNode 启动时间
D. SecondaryNameNode 应与 NameNode 部署到一个节点
答案:C
86.HDFS的namenode保存了一个文件包括哪些数据块,分布在哪些数据节点上,这些信息也存储在硬盘上。
A. 错误
B. 正确
答案:A
87.spark-ml的决策树分类器默认的特征选择方式为
A. 信息增益
B. gini指数
C. 信息增益比
答案:B
88.spark.ml中的决策树模型使用set_______来设置决策树的深度
A. Impurity
B. thresholds
C. maxDepth
D. seed
答案:C
89.对于下述代码说法正确的是?class Cat extends Animal{}
A. Animal一定是抽象类
B. Animal是Cat的子类
C. Cat是Animal的超类
D. Cat是Animal的子类。
答案:D
90.关于元组 Tuple 说法错误的是?
A. 元组最多只有2个元素
B. 元组是不可变的
C. 元组的可以包含不同类型的元素
D. 访问元组第一个元素的方式为 pair.1
答案:A
91.【判断】云计算可以有效的进行资源整合,解决资源闲置问题,提高资源利用率( )
A. 正确
B. 错误
答案:A
92.scala 中,类和它的伴生对象说法错误的是?
A. 类和它的伴生对象定义在同一个文件中。
B. 类和它的伴生对象可以实现既有实例方法又有静态方法。
C. 类和它的伴生对象可以互相访问私有特性。
D. 类和它的伴生对象可以有不同的名称。
答案:D
93.下列关于公有云和私有云描述不正确的是 ( )
A. 公有云是云服务提供商通过自己的基础设施直接向外部用户提供服务
B. 公有云能够以低廉的价格,提供有吸引力的服务给最终用户,创造新的业务价值
C. 私有云是为企业内部使用而构建的计算架构
D. 构建私有云比使用公有云更便宜
答案:D
94.spark基于什么计算
A. 网络
B. 硬盘
C. cpu
D. 内存
答案:D
95.spark 的 master 和 worker 通过什么方式进行通信的?
A. Akka
B. nio
C. netty
D. http
答案:A
96.IBM在2007年11月退出了“改进游戏规则”的 ( )计算平台,为客户带来即买即用的云计算平台。
A. EC2
B. 蓝云
C. 蓝天
D. ARUZE
答案:B
97.以下哪个不是Spark的组件
A. MultiScheduler
B. TaskScheduler
C. SparkContext
D. DAGScheduler
答案:A
98.spark-sql的前身是
A. hbase
B. mapreduce
C. hive
D. shark
答案:D
99.HBase依赖( )提供强大的计算能力。
A. Chubby
B. RPC
C. MapReduce
D. Zookeeper
答案:C
100.怎样显示当前目录( )。
A. who
B. cd
C. pwd
D. ls
答案:C
101.vi中哪条命令是不保存强制退出( )
A. :wq
B. :quit
C. :wq!
D. :q!
答案:D
102.关于主构造器,以下说法错误的是?
A. 主构造器的参数可以直接放在类名后。
B. 主构造器中可以使用默认参数。
C. 主构造器的会执行类定义中的所有语句。
D. 主构造器在每个类都可以定义多个
答案:D
103.HDFS 中的 block 默认保存几份?
A. 不确定
B. 3 份
C. 1 份
D. 2 份
答案:B
104.不属于Scala7种数值类型的是?
A. LongLong
B. Int
C. Float
D. Char
答案:A
105.关于数组val a = Array(1,2,3)下列说法错误的是?
A. val b = a.map(*2) // b 等于 Array(2,4,6)
B. val b = for(elem <- a if elem % 2 == 0) yield 2 * elem // b 等于 Array(4)
C. val b= 2 * a // b 等于 Array(2,4,6)
D. val b = for(elem <- a) yield 2 * elem // b 等于 Array(2,4,6)
答案:C
106.RDD可用哪些方式创建
A. 从Hadoop文件系统输入
B. 从父RDD转换得到新的RDD
C. 通过cache()函数将计算后的RDD缓存到内存中
D. 将数组或者集合这样的数据结构并行化
答案:ABCD
107.以下哪些操作是Action算子
A. 将一个RDD转换为一个数字
B. 将一个RDD输出为文本
C. 将一个RDD转换为另一个RDD
D. 将多个RDD转换为一个RDD
答案:AB
108.在spark中，dataframe与rdd的区别有
A. dataframe数据处理不在内存中
B. dataframe的创建接口不同
C. dataframe有表头
D. dataframe可以使用sql语言
答案:BCD
109.SparkContext可以从哪些位置读取数据
A. hdfs
B. 本地磁盘
C. 内存
D. web
答案:ABC
110.机器学习强调的关键词是：
A. 算法
B. 经验
C. 性能
D. 数据
答案:ABC
111.决策树可以解决的问题类型有
A. 二分类
B. 聚类
C. 多类分类
D. 回归
答案:ACD
112.下列哪些文件可以直接读取至dataframe中
A. csv
B. xsxl
C. json
D. txt
答案:ACD
113.下列哪些算法可以为监督学习算法
A. GMM聚类算法
B. 决策树模型
C. 逻辑斯蒂回归
D. K-mean聚类算法
答案:BC
114.“云”服务影响包括( )。
A. 交通导航服务
B. 个人服务
C. 健康服务
D. 理财服务
答案:ABCD
115.spark相比与mapreduce有哪些优势
A. 对硬件要求更低
B. 可以控制任务分区
C. 有向无环图计划
D. 将中间结果缓存在内存中
答案:BCD
116.云安全主要的考虑的关键技术有哪些?( )
A. 数据安全
B. 虚拟化安全
C. 应用安全
D. 客户端安全
答案:ABC
117.未来云计算服务面向那些客户?( )
A. 教育
B. 个人
C. 政府
D. 研究所
E. 企业
答案:ABCDE
118.目前,在国内已经提供公共云服务器的商家( )
A. 阿里巴巴
B. 华为
C. 中国移动
D. 腾讯
答案:ABCD
119.下列对象哪些是scala中的对象类别
A. 伴生对象
B. 迭代对象
C. 抽象对象
D. 单例对象
答案:AD
120.spark.ml使用的主要数据类型有
A. 本地矩阵
B. 标注点
C. 本地向量
D. 本地数组
答案:ABC
121.云计算的特性包括:( )
A. 按需计算与服务
B. 简便的访问
C. 经济型
D. 高可信度
答案:ABCD
122.下列哪个是 Hadoop 运行的模式:答案
A. 单机版
B. 分布式
C. 伪分布式
答案:ABC
123.云是一个平台,是一个业务模式,给客户群体提供一些比较特殊的IT服务,分为( )等三部分。
A. 管理平台
B. 服务提供
C. 构建服务
D. 硬件更新
答案:ABC
124.RDD的操作算子可分为哪几类
A. transformation
B. transition
C. action
D. reduction
答案:AC
125.新建一个用户hadoop的指令是{useradd hadoop}
126.查看当前linux服务器的主机名的命令是{ hostname}
127.可以调用{SparkContext}的{parallelize}，从一个已经存在的集合（数组）上创建RDD。
128.查看当前目录的命令是{pwd}
129.在spark-ml中进行特征转换，{StringIndexer}是把字符型标签转换为数字型标签，{IndexToString}是把数字型标签转换为字符型标签。
130.spark的常用组件有{spark sql}、{spark streaming}、{mllib}、{graphx}
131.机器学习流水线pipeline，在训练数据集中调用{fit}训练模型，在测试数据集上调用{transform}方法训练模型
132.在模型训练前，dataframe的数据需要用{randomSplit}方法划分成训练集和{测试集}
133.spark.ml支持本地向量Vector，其中稠密向量为Vectors.{dense}，而稀疏向量为Vectors.{sparse}
134.spark中创建dataframe的是{SparkSession}接口，一般使用其对象{spark}来创建一个dataframe。
135.spark的部署方式有{standalone}、{sparkon mesos}、{spark on yarn}、{ local}
136.格式化hdfs的指令是{hdfs namenode -format}
137.scala中所有运算都是方法，因此+2这个操作也可写成{.+(2)}
138.查看hdfs集群状态的端口是{50070}，查看yarn集群状态的端口是{8088}。
139.重新启动ssh服务器的命令是{service sshd restart}
140.将当前虚拟机的IP地址设为192.168.1.1的指令是{ifconfig eth0 192.168.1.1}
141.hadoop2.0安装成功并启动后，服务器上会有{namenode}，{datanode}，{secondnamenode}，{resourcemanager}，{nodemanager}等jps进程。
142.启动HDFS的指令是{start-dfs.sh}，启动YARN的指令是{start-yarn.sh},查看各主机进程的指令是{jps}
143.对于将来可能频繁使用的某个计算结果，可将该RDD的数据{cache}下来。
144.RDD是{只读}的、{可分区}的{分布式}数据集，这个数据集的全部或部分缓存在{内存}中
145.scala语言的两大特性是{面向对象编程}和{函数式编程}
146.在linux上用脚本方式运行scala代码时，先用{scalac}命令进行编译，编译后用{scala}命令运行
147.停止ssh服务的命令是{service sshd stop}
148.将用户hadoop加入root用户组,指令为{usermod -g root} hadoop.
149.在scala的类中若有未实现的成员，则必须使用abtract关键词进行修饰（正确）
150.rdd分区的作用是增加并行度和减少通信开销（正确）
151.监督学习即训练数据中含有标签的机器学习方法，无监督学习的训练数据中可以没有标签（正确）
152.namenode、resourcemanager和secondnamenode尽量不要分在同一服务器上（正确）
153.spark中的rdd和dataframe之间可以相互转换（正确）
154.如果 NameNode 意外终止,SecondaryNameNode 会接替它使集群继续工作。（错误）
155.spark.ml提供了基于RDD的高层次API（错误）
156.scala中的单例对象可从对应的类实例化得到（错误）
157.mapValues方法仅对键值对RDD起到其作用（正确）
158.对于同一个类，伴生对象只能有一个（正确）
159.机器学习任务可在spark上执行而无法在MapReduce上执行（错误）
160.scala项目的入口一般设在单例对象的main函数（正确）
161.spark中的dataframe支持SQL查询（正确）
162.决策树模型是一种监督学习模型（正确）
163.scala声明变量时可自动识别变量的类型（正确）
164.决策树模型是一种监督学习模型（正确）
165.Hadoop 默认调度器策略为 FIFO（正确）
166.dataframe的一行可以是任意数据类型（错误）
167.scala中的List是可变的（错误）
168.机器学习任务可在spark上执行而无法在MapReduce上执行（错误）
169.rdd的一行可以是任意数据类型（正确）
170.spark-sql支持从Mysql数据库中读取数据（正确）
171.scala特质中的方法必须定义完整（错误）
172.spark的底层源代码是scala语言编写的（正确）
173.RDD一旦创建，分区数量不能再改变（错误）
174.Slave 节点要存储数据,所以它的磁盘越大越好（错误）
175.在scala编程中，一切函数都是值，函数可以作为另一个函数的参数（正确）
176.scala中的常量可以被修改（错误）
177.scala中每个值都是对象（正确）
178.scala抽象类中的方法和变量可以不定义完整（正确）
179.spark sql中使用的数据抽象是rdd（错误）
180.scala运行与Java平台，兼容现有的Java程序（正确）
181.dataframe是一种以RDD为基础的分布式数据集（正确）
182.监督学习即训练数据中含有标签的机器学习方法，无监督学习的训练数据中可以没有标签（正确）
183.所谓“云”计算就是一种计算平台或者应用模式（错误）
184.Block Size 是不可以修改的（错误）
185.scala抽象类不能直接实例化（正确）
186.scala中声明变量类型时尽量使用变量而非常量（错误）
187.因为 HDFS 有多个副本,所以 NameNode 是不存在单点问题的（错误）
188.抽象类可以直接实例化为对象（错误）
189.spark.ml提供了基于RDD的高层次API（错误）

Linda .

关注

1
点赞
踩
32

收藏

觉得还不错? 一键收藏
打赏
0
评论
云计算题库

1.下列关于云存储的描述不正确的是 ( )A. 可以将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作。B. 需要通过集群应用、网格技术或分布式文件系统等技术实现C. 云存储通过服务的形式提供给用户使用D. “云存储对于使用者来讲是透明的”,也就是说使用者清楚存储设备的品牌,型号的具体细节答案: D2.下面哪个操作肯定是宽依赖A. flatMapB. sampleC. mapD. reduceByKey答案:D3.mapreduce的样例放在哪个目录中
复制链接

扫一扫