Day 06
241.Fusioninsight HD 中Hbase 默认使用什么组件作为其底层文件存储系统?
HDFS
242.在很多小文件场景下,Spark 会起很多Task,当SQL逻辑中存在Shuffle 操作时,会大大增加hash分桶数严重影响性能。Fusioninsight中,针对小文件的场景通常采用()算子,来对Table中的小文件生成的partition进行合并,减少partition数,从而避免在shuffle的时候,生成过多的hash分桶,提升性能?
join
243.查看kafka某Topic的partition详细信息时,使用如下那个命令?
bin/kafka-topics.sh-describe
244.以下关于Zookeeper 关键特性中的原子说法正确的是?
更新只能全部完成或失败,不会部分完成
245.下列论据中,能够支撑“大数据无所不能”的观点的是
互联网金融打破了传统的观念和行为
246.以下哪一项不属手创建Loader作业时必选项? 优先级
247.为了保证流应用的快照存储的可靠性,快照主要存储在()? HDFS中
248.如果需要由数据生产者决定数据发送给目标Bolt的某一个确定的Task,应选择以下哪种消息发布策略 直接分组
249.Flink中的()接口用于流数据处理.()接口用于批处理?
DataStream API,Dataatch API
250.以下关于Zookeeper的Leader节点在收到数据变更请求后的读写流程说法正确的是? 同时写入硬盘和内存
251.数据仓库的最终目的是 为用户和业务部门提供决策支持参考
252.关于Kafka磁盘容量不足的告警,对于可能的原因以下分析不正确的是?
Fusioninsight HD 中Loader 从 SFTP服务器导入文件时,不需要做编码转换和数据 Broker节点故障导致
253.转换且速度最快的文件类型是以下哪项? Binary-file
254.下面关于Zookeeper特性的描述错误的是? Zookeeper节点数必须为奇数个
255.Hbase中数据存储的文件格式是什么? HFile
Day 07
286如果想要修改集群的备份数量,可以修改下面哪个配置文件?
hdfs-site.xml
287 Hadoop-2.x集群中的HDFS的默认的副本块的个数是? 3
288以下哪个不是HDFS的守护进程 MRAppMaster/YARNChild
MRAppMaster/YARNChild进行是只有在YARN集群运行了MapReduce程序之后才会启动的程序
289大数据至少为以下哪种存储量级? PB
290关于HDFS集群中的DataNode的描述不正确的是?
一个DataNode上存储的所有数据块可以有相同的
291 MapReduce的Shuffle过程以下中哪个操作是最后做的? 合并
292下列关于HDFS的描述正确的是?
NameNode磁盘元数据不保存Block的位置信息
293一个gzip文件大小75MB,客户端设置Block大小为64MB,请问其占用几个Block ? 2
294如果对HBase表的添加数据记录,可以使用()命令进行操作。 put
295如果需要对HBase表中的数据进行列表查看,可以使用()命令进行操作。Scan
296以下更新HBase表中数据的语法,输写正确的是() 。
put ‘users’,’xiaoming’,’info.age’,’29’
297在HBase Shell操作中,请选择以下哪个命令用于删除整行操作() 。
deleteall ‘users’,’xiaoming’
298在HBase Shell操作中,可以使用下面哪个命令对数据表进行行数统计()。
count ‘users’
299使用JAVA API进行HBase操作,以下命令输写正确的是( ) 。
HBaseTestCase.get(tablename,’row1’);
300使用JAVA API进行HBase整表扫描操作,以下命令输写正确的是()。
table.getScanner(scan);
Day 08
331下列哪些语句关于Java内存回收的说明是正确的?
内存回收程序负责释放无用内存
332若需要定义一个类域或类方法,应使用哪种修饰符? static
333下面哪个函数是public void aMethod(){..}的重载函数?
public int aMethod( ){...}
334Java的字符类型采用的是 Unicode编码方案,每个Unicode 码占用()个比特位。 16
335以下关于继承的叙述正确的是()
在Java中类只允许单一继
336下列关于Java语言的特点,描述错误的是()
Java是面向过程的编程语言
337下述概念中不属于面向对象方法的是() 。
过程调用
338结构化程序设计所规定的三种基本控制结构是()
顺序、选择、循环
339下列关于构造方法的叙述中,错误的是()
Java语言规定构造方法不可以重载
340下列哪个类的声明是正确的?
public abstract class Car{}
341关于被私有访问控制符private修饰的成员变量,以下说法正确的是()
只能被该类自身所访问和修改
342下列关于for循环和while 循环的说法中哪个是正确的? ( )
while循环能实现的操作,for循环也都能实现
343 下列哪一个关键字用于实现接口来定义类?
implements
344下面哪一个操作符的优先级最高? ( )
345编译Java程序的命令是: javac
Day 09
376在Flask框架中,找不到与路由匹配的视图函数会返回()错误。404
377在Flask框架中设置路由的请求方法,可以使用参数()。 methods
378在ORM模型中,数据表的字段由()类实例表示。 db
379使用ORM模型插入数据时,需要将实例化对象添加到用户会话,使用的代码是() db.session.add()
380在命令行终端中,运行Flask 项目使用的命令是() flask run
381在进行模板渲染时,需要从flask中导入() render_template
382在使用Flask-WTF自定义表单类时,自定义的类需要继承自()。
FlaskForm 或 Form
383在进行模板渲染时,需要从 flask中导入()。render_template
384在使用Flask-WTF自定义表单类时,自定义的类需要继承自()。
FlaskForm 或 Form
385在Jinjia2模板引擎中实现模板的继承,使用的关键词是()。extends
386在使用Flask-WTF自定义表单类时,对字段添加验证函数,使用的参数是()
submit
387在测试Flask项目时,使用( )模块可以根据需求产生不同类型和数量的虚拟数据。 Faker
388在数据库模型中,可以指定条件对记录进行排序,使用的方法是().
Order by
389为Flask 创建自定义命令,通过创建一个函数,为该函数添加()装饰器。
@app.command
390在MapReduce中,()组件是用户不指定也不会有默认的。 Combiner
Combiner是可有可无的组件,它的作用就是用来给mapTask的结果数据做局部合并以减少reduceTask接收的数据量,以减少网络数据传输。
Day 10
421大数据在经济治理方面的作用有() 。
推导宏观趋势
打击假冒伪劣
422常见的数据污染有() 。
数据不完整
噪声数据
数据不一致
423常用的识别异常数据的方法有() 。
物理判别法
统计判别法
424数据预处理的常见方法有()。
数据清洗
数据集成
425 以下哪些属于传统可视化方法。()
直方图
折线图
饼图
426 Excel是Microsoft Office的组件之一,可以实现() 。
数据处理
统计分析
数据可视化
辅助决策
427以下哪些是制作折线图时的常见失误。()
刻度间隔太大,使得整条折现太过水平,容易掩盖事实
刻度间隔太小,使得折线太过陡峭,会夸大趋势
428统计分析方法的局限是() 。
不全面不深刻
统计决断的结论并非绝对正确
运用情况复杂,对方法要求高
429以下哪些是集中趋势分析的指标。()
均值
中位数
430关于众数说法正确的是() 。
不受分布数列的极大或极小值的影响
如果与众数组相比邻的上下两组的次数相等,则众数组的组中值就是众数值,以此类推
431四分位数的特征值是() 。
最大值、
最小值、
中位数
四分位数
432数据产生可以分为哪几个阶段。()
运营式系统阶段
用户原创内容阶段和
感知式系统阶段
433问题结构是由()构成的。
直接原因
间接原因
最终原因
434收集整理信息时的行业环境有()
行业规模及发展速度
行业竞争状况
行业挑战及机遇
435收集整理信息时的竞争分析包含哪些内容。( )
确定行业中的主要竞争者
收集竞争对手的相关信息