大数据分析师题库整理(Part Two)

Day 06

241.Fusioninsight HD 中Hbase 默认使用什么组件作为其底层文件存储系统?

HDFS

242.在很多小文件场景下,Spark 会起很多Task,当SQL逻辑中存在Shuffle 操作时,会大大增加hash分桶数严重影响性能。Fusioninsight中,针对小文件的场景通常采用()算子,来对Table中的小文件生成的partition进行合并,减少partition数,从而避免在shuffle的时候,生成过多的hash分桶,提升性能?

join

243.查看kafka某Topic的partition详细信息时,使用如下那个命令?

bin/kafka-topics.sh-describe

244.以下关于Zookeeper 关键特性中的原子说法正确的是?

更新只能全部完成或失败,不会部分完成

245.下列论据中,能够支撑“大数据无所不能”的观点的是

互联网金融打破了传统的观念和行为

246.以下哪一项不属手创建Loader作业时必选项?  优先级

247.为了保证流应用的快照存储的可靠性,快照主要存储在()?  HDFS

248.如果需要由数据生产者决定数据发送给目标Bolt的某一个确定的Task,应选择以下哪种消息发布策略 直接分组

249.Flink中的()接口用于流数据处理.()接口用于批处理?

DataStream API,Dataatch API

250.以下关于Zookeeper的Leader节点在收到数据变更请求后的读写流程说法正确的是?   同时写入硬盘和内存

251.数据仓库的最终目的是   为用户和业务部门提供决策支持参考

252.关于Kafka磁盘容量不足的告警,对于可能的原因以下分析不正确的是?

Fusioninsight HD 中Loader 从 SFTP服务器导入文件时,不需要做编码转换和数据  Broker节点故障导致

253.转换且速度最快的文件类型是以下哪项? Binary-file

254.下面关于Zookeeper特性的描述错误的是? Zookeeper节点数必须为奇数个

255.Hbase中数据存储的文件格式是什么? HFile

Day 07

286如果想要修改集群的备份数量,可以修改下面哪个配置文件?

hdfs-site.xml

287 Hadoop-2.x集群中的HDFS的默认的副本块的个数是?  3

288以下哪个不是HDFS的守护进程  MRAppMaster/YARNChild

MRAppMaster/YARNChild进行是只有在YARN集群运行了MapReduce程序之后才会启动的程序

289大数据至少为以下哪种存储量级?  PB

290关于HDFS集群中的DataNode的描述不正确的是?

一个DataNode上存储的所有数据块可以有相同的

291 MapReduce的Shuffle过程以下中哪个操作是最后做的?  合并

292下列关于HDFS的描述正确的是?

NameNode磁盘元数据不保存Block的位置信息

293一个gzip文件大小75MB,客户端设置Block大小为64MB,请问其占用几个Block ? 2

294如果对HBase表的添加数据记录,可以使用()命令进行操作。  put

295如果需要对HBase表中的数据进行列表查看,可以使用()命令进行操作。Scan

296以下更新HBase表中数据的语法,输写正确的是() 。

put ‘users’,’xiaoming’,’info.age’,’29’

297在HBase Shell操作中,请选择以下哪个命令用于删除整行操作() 。

deleteall ‘users’,’xiaoming’

298在HBase Shell操作中,可以使用下面哪个命令对数据表进行行数统计()。

count ‘users’

299使用JAVA API进行HBase操作,以下命令输写正确的是( ) 。

HBaseTestCase.get(tablename,’row1’);

300使用JAVA API进行HBase整表扫描操作,以下命令输写正确的是()。

table.getScanner(scan);

Day 08

331下列哪些语句关于Java内存回收的说明是正确的?

内存回收程序负责释放无用内存

332若需要定义一个类域或类方法,应使用哪种修饰符? static

333下面哪个函数是public void aMethod(){..}的重载函数?

public int aMethod( ){...}

334Java的字符类型采用的是 Unicode编码方案,每个Unicode 码占用()个比特位。  16

335以下关于继承的叙述正确的是()

在Java中类只允许单一继

336下列关于Java语言的特点,描述错误的是()

Java是面向过程的编程语言

337下述概念中不属于面向对象方法的是() 。

过程调用

338结构化程序设计所规定的三种基本控制结构是()

顺序、选择、循环

339下列关于构造方法的叙述中,错误的是()

Java语言规定构造方法不可以重载

340下列哪个类的声明是正确的?

public abstract class Car{}

341关于被私有访问控制符private修饰的成员变量,以下说法正确的是()

只能被该类自身所访问和修改

342下列关于for循环和while 循环的说法中哪个是正确的? ( )

while循环能实现的操作,for循环也都能实现

343 下列哪一个关键字用于实现接口来定义类?

implements

344下面哪一个操作符的优先级最高?   ( )

345编译Java程序的命令是:  javac

Day 09

376在Flask框架中,找不到与路由匹配的视图函数会返回()错误。404

377在Flask框架中设置路由的请求方法,可以使用参数()。 methods

378在ORM模型中,数据表的字段由()类实例表示。 db

379使用ORM模型插入数据时,需要将实例化对象添加到用户会话,使用的代码是()  db.session.add()

380在命令行终端中,运行Flask 项目使用的命令是() flask run

381在进行模板渲染时,需要从flask中导入() render_template

382在使用Flask-WTF自定义表单类时,自定义的类需要继承自()。

FlaskForm 或 Form

383在进行模板渲染时,需要从 flask中导入()。render_template

384在使用Flask-WTF自定义表单类时,自定义的类需要继承自()。

FlaskForm 或 Form

385在Jinjia2模板引擎中实现模板的继承,使用的关键词是()。extends

386在使用Flask-WTF自定义表单类时,对字段添加验证函数,使用的参数是()

submit

387在测试Flask项目时,使用( )模块可以根据需求产生不同类型和数量的虚拟数据。 Faker

388在数据库模型中,可以指定条件对记录进行排序,使用的方法是().

Order by

389为Flask 创建自定义命令,通过创建一个函数,为该函数添加()装饰器。

@app.command

390在MapReduce中,()组件是用户不指定也不会有默认的。 Combiner

Combiner是可有可无的组件,它的作用就是用来给mapTask的结果数据做局部合并以减少reduceTask接收的数据量,以减少网络数据传输。

Day 10

421大数据在经济治理方面的作用有() 。

推导宏观趋势

打击假冒伪劣

422常见的数据污染有() 。

数据不完整

噪声数据

数据不一致

423常用的识别异常数据的方法有() 。

物理判别法

统计判别法

424数据预处理的常见方法有()。

数据清洗

数据集成

425 以下哪些属于传统可视化方法。()

直方图

折线图

饼图

426 Excel是Microsoft Office的组件之一,可以实现() 。

数据处理

统计分析

数据可视化

辅助决策

427以下哪些是制作折线图时的常见失误。()

刻度间隔太大,使得整条折现太过水平,容易掩盖事实

刻度间隔太小,使得折线太过陡峭,会夸大趋势

428统计分析方法的局限是() 。

不全面不深刻

统计决断的结论并非绝对正确

运用情况复杂,对方法要求高

429以下哪些是集中趋势分析的指标。()

均值

中位数

430关于众数说法正确的是() 。

不受分布数列的极大或极小值的影响

如果与众数组相比邻的上下两组的次数相等,则众数组的组中值就是众数值,以此类推

431四分位数的特征值是() 。

最大值、

最小值、

中位数

四分位数

432数据产生可以分为哪几个阶段。()

运营式系统阶段

用户原创内容阶段和

感知式系统阶段

433问题结构是由()构成的。

直接原因

间接原因

最终原因

434收集整理信息时的行业环境有()

行业规模及发展速度

行业竞争状况

行业挑战及机遇

435收集整理信息时的竞争分析包含哪些内容。( )

确定行业中的主要竞争者

收集竞争对手的相关信息

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值