东方航空管控集市数据数据研发岗笔试题

这是一篇关于东方航空数据研发岗位笔试题目的总结,涵盖了数组声明、Spring框架、数据仓库、数据治理、指标开发等多个方面的知识点,包括编程语言的基础、大数据处理、数据库操作、数据结构和算法等内容,旨在测试应聘者的编程能力、数据处理和分析技能。
摘要由CSDN通过智能技术生成

数据研发面试题

1. (单选题)

下面哪一个是合法的数组声明和构造语句(B)

A. int[] ages=[100]:

B.int ages = new int [100] :

c.int[] ages = new int [1001:

D.int() ages = new int (100) :

2,Spring"@Transactional 注解是用AOP实现的,是否正确(B)

A.     错误

B.     正确

3,下列关于修饰符混用的说法,错误的是(A )

A. abstract不能与final并列修饰同一个类

B. abstract类中可以有pnivate的成员

C. c. abstract方法必须在abstract类中

D. static方法中能处理非static的属性

4. (单选题)

分析下面的数据研发代码片段,编译运行后的输出结果是(B)

for(int i=0;i<6;i++) {

int k=++i;

while(k<5) {

System. out. println(i); break; } }

A. 024

B.24

c. 123

B.13

5. (单选题)

HDFs是基于流数据模式访问和处理超大文件的需求而开发的,

具有高容错、高可靠性、高可扩展性、高香吐率等特征,适合的读写任务是(D)

A.-次写入,少次读

B.多次写入,少次读

c多次写入,多次读

D-次写入,多次读

6. (单选题)

有关数据冗余说法正确的是(C)

A.数据库中,数据存在副本的现象,就是数据冗余。

B.通过分类存储,可以有效减少数据冗余,但是会增加数据查找的复杂性。

c.在数据库设计阶段,-定要尽最大可能避免数据冗余,最好做到无教据冗余。

D.数据冗余通常是由于数据库设计引起的。

7. (单选题)

数据研发语言中, String类的Index0f (0)方法返回的类型是(C)

A. Int16

B. Inl2 ;

c. int

D. long

8. (单选题)

在数据研发Script中如何验证一个数据是否是数字(A)

A.如果用Integer. parseInt (value)有误就不是数字

B.intI=value若报错就不是数字,

c.没有方法验证

D.利用isHaN(value) 回的boolean进行判断

9. (单选题)

下列哪种不是List集合的遍历方式(D)

A. Iterator迭代器实现

B.增强for循环实现

c. get 0)size()方法结合实现

D. get ()length()方法结合实现

10. (单选题)

在数据研发中,以下哪个可以与函数publicpint a0 (-- )构成重载(B )

A. public void A() (--)

B. public int A(int m)()

c. public void A(int n) ()

D. public static int A()(-)

11. (单选题)

数据仓库的最终目的是(D)

A.收集业务需求

B.建立数据仓库逻辑模型

c.开发数据的应用分析

D.为用户和业务部门提供决策支持

12. (单选题)

-个射手连续射靶22,其中3次射中10, 7次射中9, 9次射中8, 3次射中7.则射中环数的中位数和众数分别为(B)

A.8, 9

B.8, 8

c.8- 58

D.8.59

13. (单选题)

差为2的是( A)

A.1, 2, 3, 4, 5

B.01, 235

c.222, 2, 2

D.2, 2, 2, 33

14. (单选题)

下面哪项不属于数据研发语言的基本数据类型(B)

A. int .

B. String

c. double .

D. booleants

15. (单选题)

0racle,下列哪种标量类型不能保存到数据研发表中(B )

A. CHAR

B. RAW

c. DATE

D. BOOLEAN

16. (单选题)

HBase依赖什么提供消息通信机制(A)

A Zookeeper

B Chubby

c RPC

D Socket

17. (单选题)

下面哪些不是sparkMapreduce计算快的原因(D)

A.基于内存的计算

B.基于DAG的调度框架

c.基于Lineage的容 错机制

D.基于分布式计算的框架

18. (单选题)

HIvE的元数据不能存在哪(A)

A. HDFS

B. derby

c. MIySqI

D. Iablestore

19. (单选题)

下面与2ookeeper类似的框架是?(D)

A. Prot obuf

B.Java

c. Kafka

D. Chubby

20. (单选题)

HFile数据格式中的Data字段用于(A)

A.存储实际的KeyValue数据

B.存储数据的起点

c.指定字段的长度

D.存储数据块的起点

21. (单选题)

关系数据模型的基本数据结构是( D)

A.

B..

c.索引

D.关系

D 30

22. (单选题)

Spring DAO中最常用的类是(A)

A. JdbcTemplateSimpleJ dbcTemplate

B. Simp1eJ dbcInsert, SimpleJ dbcProcedure

c. SimpleJdbcInsert SimpleJ dbcStox[jIProc

D. SimpleJdbcQuerySimpleJ dbcExec

23. (单选题)

下列不属于大数据离线分析平台使用的组件有(A)

A. HDFS

B. IR

c. Hive

D. Hbase

24. (单选题)

如果在排序过程中,每次均将一个待排序的记录按关键字大小加入到前面已经有序的中的适当位置,则该排序方法称为(A )

A.插入排序

B.归并排序

c.冒泡排序

D.堆排序

25. (单选题)

spark下面哪个操作肯定是宽依赖(C)

A. map

B. flalap

c. reduceByKey

D. sample

26. (单选题)

spark. deploy. recoveryllode不支持那种(D)

A. Zoo

B. FileSystem

c. nOme

D. hadoop

27. (单选题)

对用户访问数据研发的权限加以限定是为了保护数据研发的( B)

A.完整性.

B.安全性

c.并发控制

D.系统恢复

28. (单选题)

把数据按照相似性归纳成若干类别的是(D)

A.概念描述

B.关联分析

c.分类

D.聚类

29. (判断题)

如果Hanelode意外终止, SecondaxryHamelHode 会接替它使集群继续工作(A)

A错误

B正确

30. (单选题)

多线程与多进程的主要区别之-就是共享资源,多线程是通过互斥访问来协调共享资源,Vindows系统中使用什么对象使多线程之间对资源互斥访问( C)

A. SysTherad

B. Init Iherad

c. MutexL

D. Select

31. (单选题)

用于调用存储过程的对象是( C)

A. ResultSet

B. DriverManager

c. CallableStatemet

D. PreparedSt atement

32. (单选题)

按照mrvc设计模式, JSP用于实现(C )

A. Model

B. View

c. Controller

D.容器

33. (单选题)

hive的元数据存储在derby MySQL中有什么区别(B)

A.没区别

B.多会话

c.支持网络环境

D.数据库的区别

34. (单选题)

Servlet的生命周期中,容器只调用一次的方法是(C )

A. service

B. getServletConfig

c. init

D. destroy

35. (单选题)

lMasterElectedLeader 事件后做了哪些操作(D)

A.通知driver

B.通知worker

c.注册application

D.直接ALIVE

36.多选题)

下列说法错误的有( ACD)

A.在类方法中可用this来调用本类的类方法

B.在类方法中调用本类的类方法时可直接调用

c.在类方法中只能调用本类中的类方法

D.在类方法中绝对不能调用实例方法

37.多选题)

执行下列代码后,哪个结论是正确的String[] s=new String [10];(BD)

A. s[9] null:

B. s[10]为“”

C.s[0]为未定义

D. s. length10

38.多选题)

下列等价类的叙述中正确的是(ABD )

A.若输入条件为一个布尔变里,则可以确定-个有效等价类和一个无效等价类

B.若输入条件为一个逻辑里,则可为每一个输入值确定一个有效等价类,并针对这组值确定- .个无效等价类

c.若输入条件规定了“必须如何”的条件,则可以确定-个有效等价类和两个无效等价类

D.若输入条件规定了取值的上下限,则可以确定一个有效等价类和两个无效等价类

39.多选题)

大数据人才整体上需要具备(ABE)等核心知识。

A.数学与统计知识

B.计算机相关知识

c.马克思主义哲学知识

D.市场运营管理知识

e.在特定业务领域的知识

40.(多选题)

以下关于Hadoop描述哪些是不正确的(BD)

A.Ganglia可以对Hadoop集群进行监控和报警;

B. HDFS支持数心的随机读写;

c. HDFSBlock默认保存3;

D. Yarn中默认的调度器是Fair Schedular;

1. (单选题)

假设下列字符码中有奇偶校验位,但没有数据错误,采用偶校验的字符码是(A )

A. 11010110

B. 1000001 .

C. 11001011

D.11001001

2. (单选题)

下列程序的运行结果是(  C)

#inc lude<stdio. h>

void f(int *p)

{p[0]=*(p+2):}

main()

{int a[10]={1,2,3, 4,5,6,7,8,9,0},i;

for(i=3;i>=0;i-) f(a+i);

for(i=0;i<10;i++) printf( %d,a[i]);

printf(\n):}

A.3334567890

B.5656567890

c.5555567890

D.4444567890

3. (单选题)

数据仓库的最终目的是(D)

A.收集业务需求

B. 建立数据仓库逻辑模型

C. 开发数据仓库的应用分析

D.为用户和业务部i ]提供决策支持

4. (单选题)

MapReduce作业运行机制中,(C )负责作业的协调运行

A. JobTask

B. TaskTracker

C. JobTracker

D. JobClient

5. (单选题)

根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C )

A.数据管理人员

B.数据分析员◎

C.研究科学家

D.软件开发工程师

6. (单选题)

在数据研发Script中如何验证- -个数据是否是数字(D)

A.如果用Integer. parseInt (value)有误就不是数字

B. int I = value若报错就不是数字。

c.没有方法验证

D. 利用i sNaN(value) 回的boolean进行判断

7. (单选题)

下列关于聚类挖掘技术的说法中,错误的是(B)

A.不预先设定数据归类类日,完全根据数据本身性质将数据聚合成不同类别

B. 要求同类数据的内容相似度尽可能小

c. 要求不同类数据的内容相似度尽可能小

D. 与分类挖掘技术相似的是,都是要对数据进行分类处理

8. (单选题)

现有如下代码段:

x=2;

while(x<n/2)

x =2*x;

假设n>=0,则其时间复杂度应为( A)

A.0(log2n)

B.0(nlog2n)

c.0(n)

D. 0(n^2)

9. (单选题)

采用数据分层的思想来构建大数据分析平台,不包括下面哪项(B )

A. 0DL-目标解释语言

B.HDL.-硬件描述语盲

C. IDL一接口描述语言

D. ADL

10. (单选题)

下面关于JVM的叙述正确的是(A)

A. JVM运行于操作系统之上,它依赖操作系统

B. JVi运行 于操作系统之上.它与操作系统有关

c. JVMI支持Java程序运行, 它能直接运行Java?节码文件

D. JVM支持Java程序运行, 它能直接运行Java源代码文件

11. (单选题)

大数据的最显著特征是(A)

A.数据规模大

B.数据类型多样

C.数据处理速度快

D.数据价值密度高

12. (单选题)

大数据环境下的隐私担忧,主要表现为(A)

A.个人信息的被识别与暴露

B.用户画像的生成

C.悲意广告的推送

D. 病毒入侵

13. (单选题)

对线下零售而言,做好大数据分析应用的前提是(C )

A.增加统计种类

B. 扩大营业面积

c.增加数据来源

D.开展优惠促销

14. (单选题)

0racle中,用下列语句定义了一个过程:

CREATE OR REPLACE PROCEDURE test(a IN VARCHAR2,

b IN OUT NUMBER,

c OUT VARCHAR2) IS

BEGIN

.....

END;

/

假定使用的变量都己定义,下 面对过程test的调用语法正确的是( C)

A. test( 'Stringl' ,50,v_ str2)

B. test(v_ strl,v_ numl,' String2' )

C. test( 'Stringl' v numl,v_ str2)

D. test(v_ str1, 20,v_ str2)

15. (单选题)

下列关于大数据的分析理念的说法中,错误的是(D)

A.在数据基础上倾向于全体数据而不是抽样数据

B. 在分析方法上更注重相关分析而不是因果分析

C.在分析效果上更追求效率而不是绝对精确

D. 在数据规模上强调相对数据而不是绝对数据

16. (单选题)

0racle中,事务中使用下列SQL语句不会引起锁定( A)

A. SELECT

B. INSERT

C. UPDATE

D. DELETE

17. (单选题)

关于sleep()wait(),以下描述错误的一-项是(D)

A. sleep是线程类(Thread)的方法。wait0bject 类的方法

B. Sleep不释放对象锁,wai t放弃对象锁

C. Sleep暂停线程、但监控状态任然保持,结束后会自动恢复

D. Wait后进入等待锁定池,只针对此对象发出notify方法后获取对象锁进入运行状态

18. (单选题)

下列关于聚类挖掘技术的说法中,错误的是(B)

A.不预先设定数据归类类日,完全根据数据本身性质将数据聚合成不同类别

B.要求同类数据的内容相似度尽可能小

c. 要求不同类数据的内容相似度尽可能小

D. 与分类挖掘技术相似的是,都是要对数据进行分类处理

19. (单选题)

下面与HDPS类似的框架是( C)

A. NTFS

B. FAT32

C. GFS

D. EXT3

20. (单选题)

下列哪些不是面向对象技术的特征(D)

A封装

B继承

c多态

D分布性

21. (单选题)

触发器允许触发操作的语句访问行的列值(A)

A行级:old:new

B 语句级

c模式

D数据库级

22. (单选题)

下面哪个程序负责HDFS数据存储?(B)

A. NameNode

B. Jobtracker

C. Datanode

D. secondaryNameNode

OE. tasktracker

23. (单选题)

Math. floor(-8. 5)是多少(D)

A. (float)-8. 0

B. (long)-9

C. (long)-8

D. (double)-9. 0

24. (单选题)

已知表达式int m[] = {0,1,2,3,4,5, 6};下面那个表达式的值与数组的长度相等(B)

A. m length(

B. m. length

C. m. length0+1

D. m. length+1

25. (单选题)

以下属于Redis支持的数据类型是(D)

A. Strings

B. Lists

c. Sets

D.以上都是

26. (单选题)

以下哪- -项不属于hadoop可以运行的模式( C)

A.单机模式

B. 伪分布式模式

c.互联模式.

D.分布式模式

27. (单选题)

关于"@Order注解,最正确的描述是(A)

A. 实现org. springframework. core. Ordered接口

B.指定一个bean的范围

C.通常用于注入域对象的属性

D.全不正确

28. (单选题)

shufflesort输出的key实现了下面的哪个接口(B)

A. Wri table

B. WritableComparable

C. Configurable

D. ComparableWri table

29. (单选题)

HashMapHashTable的描述,错误的是(D )

A.他们都实现了Map接口。

B. HashMap非线程安全,在多个线程访间Hashtable时,不需要自已为它的方法实现同步。而HashMap就必须为之 提供额外同步。

C. HashMap允诈将nul1作为- entrykey或者value,iHashtable不允许。

D. 通过contains方法可以判断一个对象 是否存在FHashMap或者Hashtable

30. (判断题)

如果NameNode意外终止,SecondaryNameNode 会接替它使集群继续工作(D)

●错误

●正确.

31. (单选题)

scala中,下面的哪个类定义是不正确的(A)

A. class Counter {def counter =counter}

B. class Counter{val counter = counter}

C. class Counter {var counter:String}

D. class Counter {def counter () {}

32. (单选题)

多线程与多进程的主要区别之一就是共享资源, 多线程是通过互斥访问来协调共享资源,在Windows 系统中使用什么对象使多线程之间对资源互斥访问(C )

A. SysTherad

B. Ini tTherad

C. Mutex

D. Select

33. (单选题)

默认的存储级别(A)

A. MEMORY_ _ONLY

B. MEMORY_ ONLY_ SER

C. MEMORY_ AND_ DISK

D. MEMORY_ AND_ DISK_ SER

34. (单选题)

Spring中,BeanFactory是流行的装载bean的方式,下面哪个选项是正确的创建BeanFactory的方式(D)

A. BeanFactory factory = new BeanFactory (new FileInputStream(beans. xml" ));

B. BeanFactory factory = new XmlBeanFactory(cl asspath:beans. xml" );

C. BeanFactory factory = new BeanFactory(beans. xm1" ); .

D. BeanFactory factory = new XmlBeanFactory (newFileInputStream( "beans. xml" )):

35. (单选题)

HashMap的数据结构是怎样的(C )

A.数组

B.链表

C.数组+链表

D.二叉树

36.(多选题)

关于Spring容器,下面说法正确的是(ABD )

A. Spring容器也叫IoC容器,本质上就是一一个工厂

B. Spring容器不但可以管理Bean.还能管理Bean的生命周期、作用域

C.一个web应用中,通常只有一一个Spring容器,该容器需要我们主动创建

D. Spring容器的项层接口是BeanFactory.而常用的是其子接I 1Appl icationContext

37.(多选题)

以下哪个是Spark的组件(BCD )

A. DACScheduler

B. MultiScheduler

C. TaskScheduler

D. SparkContext

38.(多选题)

有关单例模式的说法中正确的是(ABC )

A.用户无法通过new方式实例化单例类

B.单例模式属于创建型模式

C.单例模式用f多线程应用程序

D.违背了单一职责原则

39.(多选题)

集合类包括ArrayListLinkedList. HashMap等类,下列关 于集合类描述正确的是(AB)

A. ArrayListinkedList均实现 List接口

B. ArrayLi st的访问速度比LinkedList

C.添加和刷除元素时,ArrayList的表现更佳

D. HashMap实现Map接口,它允许任何类型的键和值对象,并允许将mul 1用作键或值

40.(多选题)

下列关于大数据的说法中,错误的是( AD)

A.大数据具有体量大、结构单- -、时效性强的特征

B.处理大数据需采用新型计算架构和智能算法等新技术

C.大数据的应用注重相关分析而不是因果分析

D.大数据的应用注重因果分析而不是相关分析

E.大数据的目的在于发现新的知识与润察并进行科学决策

1. (单选题)

假设下列字符码中有奇偶校验位,但没有数据错误,采用偶校验的字符码是(A )

A. 11010110

B. 1000001 .

C. 11001011

D.11001001

2. (单选题)

下列程序的运行结果是( C )

#inc lude<stdio. h>

void f(int *p)

{p[0]=*(p+2):}

main()

{int a[10]={1,2,3, 4,5,6,7,8,9,0},i;

for(i=3;i>=0;i-) f(a+i);

for(i=0;i<10;i++) printf( %d,a[i]);

printf(\n):}

A.3334567890

B.5656567890

c.5555567890

D.4444567890

3. (单选题)

数据仓库的最终目的是(D)

A.收集业务需求

B. 建立数据仓库逻辑模型

C. 开发数据仓库的应用分析

D.为用户和业务部i ]提供决策支持

4. (单选题)

MapReduce作业运行机制中,(C )负责作业的协调运行

A. JobTask

B. TaskTracker

C. JobTracker

D. JobClient

5. (单选题)

根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C )

A.数据管理人员

B.数据分析员◎

C.研究科学家

D.软件开发工程师

6. (单选题)

在数据研发Script中如何验证- -个数据是否是数字(D)

A.如果用Integer. parseInt (value)有误就不是数字

B. int I = value若报错就不是数字。

c.没有方法验证

D. 利用i sNaN(value) 回的boolean进行判断

7. (单选题)

下列关于聚类挖掘技术的说法中,错误的是(B)

A.不预先设定数据归类类日,完全根据数据本身性质将数据聚合成不同类别

B. 要求同类数据的内容相似度尽可能小

c. 要求不同类数据的内容相似度尽可能小

D. 与分类挖掘技术相似的是,都是要对数据进行分类处理

8. (单选题)

现有如下代码段:

x=2;

while(x<n/2)

x =2*x;

假设n>=0,则其时间复杂度应为( A)

A.0(log2n)

B.0(nlog2n)

c.0(n)

D. 0(n^2)

9. (单选题)

采用数据分层的思想来构建大数据分析平台,不包括下面哪项(B )

A. 0DL-目标解释语言

B.HDL.-硬件描述语盲

C. IDL一接口描述语言

D. ADL

10. (单选题)

下面关于JVM的叙述正确的是(A)

A. JVM运行于操作系统之上,它依赖操作系统

B. JVi运行 于操作系统之上.它与操作系统有关

c. JVMI支持Java程序运行, 它能直接运行Java?节码文件

D. JVM支持Java程序运行, 它能直接运行Java源代码文件

11. (单选题)

大数据的最显著特征是(A)

A.数据规模大

B.数据类型多样

C.数据处理速度快

D.数据价值密度高

12. (单选题)

大数据环境下的隐私担忧,主要表现为(A)

A.个人信息的被识别与暴露

B.用户画像的生成

C.悲意广告的推送

D. 病毒入侵

13. (单选题)

对线下零售而言,做好大数据分析应用的前提是(C )

A.增加统计种类

B. 扩大营业面积

c.增加数据来源

D.开展优惠促销

14. (单选题)

0racle中,用下列语句定义了一个过程:

CREATE OR REPLACE PROCEDURE test(a IN VARCHAR2,

b IN OUT NUMBER,

c OUT VARCHAR2) IS

BEGIN

.....

END;

/

假定使用的变量都己定义,下 面对过程test的调用语法正确的是( C)

A. test( 'Stringl' ,50,v_ str2)

B. test(v_ strl,v_ numl,' String2' )

C. test( 'Stringl' v numl,v_ str2)

D. test(v_ str1, 20,v_ str2)

15. (单选题)

下列关于大数据的分析理念的说法中,错误的是(D)

A.在数据基础上倾向于全体数据而不是抽样数据

B. 在分析方法上更注重相关分析而不是因果分析

C.在分析效果上更追求效率而不是绝对精确

D. 在数据规模上强调相对数据而不是绝对数据

16. (单选题)

0racle中,事务中使用下列SQL语句不会引起锁定( A)

A. SELECT

B. INSERT

C. UPDATE

D. DELETE

17. (单选题)

关于sleep()wait(),以下描述错误的一-项是(D)

A. sleep是线程类(Thread)的方法。wait0bject 类的方法

B. Sleep不释放对象锁,wai t放弃对象锁

C. Sleep暂停线程、但监控状态任然保持,结束后会自动恢复

D. Wait后进入等待锁定池,只针对此对象发出notify方法后获取对象锁进入运行状态

18. (单选题)

下列关于聚类挖掘技术的说法中,错误的是(B)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一鸣888

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值