京东2017校园招聘数据与算法方向笔试题

昨天做了一下京东的在线笔试。京东这次笔试题分为三个部分,第一部分是选择题30道,第二部分是2道编程题,第三部分是5道实用性更强的选择题。这里仅贴出题目,不提供答案。

一、选择题

1设循环队列的容量为50(序号从049),现经过一系列的入队和出队运算后,有front=16rear=5rear指向队尾元素的后一位置),当前循环队列中元素个数为()

A12      B11      C40      D39

 

2、以下序列是堆的是()

A{60 , 50 , 40 , 30 , 35 , 45 , 38 , 20}

B{20 , 30 , 40 , 35 , 50 , 45 , 60 , 38}

C{60 , 45 , 50 , 35 , 38 , 40 , 30 , 20}

D{60 , 40 , 50 , 35 , 30 , 45 , 38 , 20}

 

3、从邻接矩阵


可以看出,该图中含有顶点的个数为()

A5      B9      C4      D3

 

4、采用计数排序算法对数组A = {1,0,3,1,0,1,1}进行排序,则辅助数组C的长度值为()

A4      B6      C5      D7

 

5[多选题]关于计数排序的叙述中正确的是()

A、计数排序是一种基于比较的排序算法

B、计数排序的时间复杂度为O(n)

C、计数排序的空间复杂度为O(n)

D、计数排序是原地排序算法

 

6、利用归并排序方法对数字序列:5,19,17,21,11,8,1进行排序,共需要进行()次比较

A14      B12      C11      D10

 

7、有一语法制导方法如下,其中“+”表示符号连接运算:

S→B     {print(B.reverse)}

B→a     {B.reverse=a}

B→b     {B.reverse=b}

B→Ba    {B.reverse=a+B.reverse}

B→Bb    {B.reverse=b+B.reverse}

若输入符号串abab,则采用自底向上语法分析方法时,输出为()

Ababa      Baabb      Cbbaa      Dabab

 

8、后缀式abc+*所代表的表达式为()

Aa*(b+c)      Ba*b+c      C(a+b)*c      Da+b*c

 

9[多选题]关于决策树的说法中,以下哪些是正确的?()

A、冗余属性不会对决策树的准确率造成不利的影响

B、子树可能在决策树中重复多次

C、寻找最佳决策树是NP完全问题

D、决策树算法对于噪声的干扰非常敏感

 

10[多选题]SPSS中,数据整理的功能主要集中在()等菜单中。

A、转换      B、数据      C、直销      D、分析

 

11、一般,k-NN最近邻方法在()的情况下效果最好

A、样本较少但典型性好

B、样本呈团状分布

C、样本呈链状分布

D、样本较多但典型性不好

 

12、[多选题]用户A被视为可信任连接用户,用户B通过账号密码匹配方式通过身份验证。AB都想使用数据库中的数据,一下正确的做法是()

A、对于用户A,可以直接为其创建登录账户

B1创建SQL SERVER 用户BBB

        2 EXEC SP_ADDLOGIN ‘BBB’

C1创建windows用户AAA

        2 EXEC SP_GRANTLOGIN ‘I075\AAA’

D、通过身份验证知识第一步,只有在有效地账号管理下获取访问数据库权限后,才能访问数据

 

13、windows系统path系统变量路径之间的分隔符是()

A;      B,      C:      D.

 

14、下列掩码中,相对应的网络前缀有15位的是哪个?()

A255.224.0.0      B192.0.0.0     C240.0.0.0      D255.255.255.252

 

15[多选题]简单网络管理协议SNMP是由哪几个部分组成?()

A、管理信息结构SMI

BSNMP的信息库

CSNMP本身

D、管理信息库MIB

 

16SPSS的界面中,以下是主窗口的是()

A、数据编辑窗口

B、脚本编辑窗口

C、语法编辑窗口

D、结果输出窗口

 

17PAD图也称问题分析图,其特点是()

A、在PAD图中,用方框表示一个处理步骤,菱形表示一个逻辑条件,箭头表示控制流向

B、在PAD图中只能描述结构化程序允许使用的几种基本结构

C、在需求分析中,使用PAD图可形象、直观地描述用户的问题

DPAD图用一条横线表示程序的主线,每增加一个层次,图像就向下扩展一层

 

18、为开发客户关系管理系统,小马反复询问用户有关软件的功能,确定软件做什么。该阶段属于软件生命周期中的()阶段

A、软件测试

B、需求分析

C、系统维护

D、软件设计

 

19、以下关于数据流图中加工的编号说法错误的是()

A、在一张图的内部用局部加工编号就可区别不同的加工

B、顶层图的图编号为1

C、子图的编号就是父图中相应加工的编号

D、子图中加工的编号由子图号、小数点、局部加工编号连接而成

 

20、某软件系统结构图如图所示,该结构图的深度为()

 

A3      B4      C2      D5

 

21、隐马尔可夫模型三个基本问题以及相应的算法说法正确的是()

A、解码——维特比算法

B、评估——前向后向算法

C、学习——前向后向算法

D、学习——Baum-Welch算法

 

22、在MySql中,在Product表中,使用全文索引在detail列中搜索包含“rabbit”的列,则下列语句正确的是()

Aselect *from product where mactch (detail) fulltext (‘rabbit’)

Bselect *from product where mactch (detail) against (‘rabbit’)

Cselect *from product where against (detail) mactch (‘rabbit’)

Dselect *from product where fulltext (detail) mactch (‘rabbit’)

 

23、查看后台进程作业ID的指令是()

Ajobs      Bls      Cps      Dpg

 

24[多选题]dns区域配置文件默认有()

Alocalhost.zone

Bdns.conf

Cloalhost

Dnamed.local

 

25、在SPSS的基础分析模块中,作用是“以行列表的形式揭示数据之间的关系”的是()

A、数据描述

B、相关

C、交叉表

D、多重相应

 

26、在集中式共享存储器阵列处理集中,ICN主要作用是()

A、其它选项均不正确

B、处理单元与处理单元的数据通路

C、处理单元与存储体的数据通路

D、处理单元通过存储体互相交换数据

 

27[多选题]对于多处理机系统性能的几种模型分析得到的结论正确的是()

A、采用粗粒度,能够获得较大的R/C比值,并行程度将大为降低

B、处理机台数增加时,额外开销时间也增加;但额外开销的增加不可能比处理机数目的线性增加快

C、多处理机系统的额外开销包括调度、对共享资源的竞争、同步、处理机之间通信等

D、为了得到较高的性价比,处理机数目存在一个极大值

 

28[多选题]以下描述错误的是()

A、在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差

BSVM是这样一个分类器,它寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器(minimal margin classifier

C、聚类分析可以看作是一种非监督的分类

D、在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题

 

29Bash环境中挂起当前进程的方式是()

Actrl+x      Bctrl+v      Cctrl+c      Dctrl+z

 

30、[多选题]在分析句子结构时,句子内部组织结构用树来表示,组成的结构具有显著的特点是()

A、循环

B、修饰语

C、中心词

D、递归

二、编程题

1、(爬山)

时间限制:C/C++语言1000MS;其它语言3000MS

内存限制:C/C++语言65526KB;其它语言589824KB

题目描述:B曾经酷爱网络游戏,整日通宵达旦地玩游戏,导致身体素质急剧下降,因此下决心痛改前非,远离一切电子产品,并通过远足爬山的方式改变生活方式并提高身体素质。由于担心对身体造成太大的负荷,他总是选择最平坦的路径,并记录每天的行程情况及达到的最高海拔,使得连续两天之间的海拔之差最多为一个单位。不幸的是,在行程结束时,他不小心掉进河里,造成部分记录信息遗失。他想知道自己行程中可能达到的最高海拔,你是否能够帮忙?

输入:

输入有若干组,每组的第一行为空格分隔的两个整数nm1<=n<=10^8,1<=m<=10^5,分别表示行程天数以及未遗失的记录数。随后紧跟m行,每行为空格分隔的两个整数dh1<=d<=n0<=h<=10^8,表示行程的第几天及当天达到的最高海拔。

输出:

对每组输入,如果记录是可能的,则在单独的行中输出可能达到的最高海拔,否则输出字符串”IMPOSSIBLE”(不含引号)。

样例输入:

8 2

2 0

7 0

8 3

2 0

7 0

8 3

样例输出:

2

IMPOSSIBLE

Hint

第一天和最后一天的海拔可以是任意值。

 

2、(最佳位置)

时间限制:C/C++语言1000MS;其它语言3000MS

内存限制:C/C++语言65526KB;其它语言589824KB

题目描述:B热衷于体育运动赛事活动,这样她就可以发挥自己的一项特长——赛事解说。小B因为自身的高颜值,加之评论犀利到位、语言诙谐,因此拥有一大批粉丝。

一年一度的运动会又即将开始,这将是一个激动人心的季节,每个人都有自己的目标:运动员希望奋力争夺奖牌,观众希望欣赏到心仪运动员的精彩表现,解说员则要争抢更方便的位置以便观看和评论。

今天的赛事在三个圆形的运动场同时举行,小B希望能够在此次的赛事解说中再展风姿,占据最佳的观察点,从而能够观看所有运动场上的比赛。由于今天的所有赛事同等重要,她希望以相同视角(观察点到运动场边缘切线的夹角)观看运动场。如果满足条件的观察点不止一个,她希望首选具有最大视角的观察点。

B对寻找观察点不是很在行,她希望请你帮忙寻找最合适的观察点。需要指出的是,运动场馆都是露天的,解说员的视线不受遮挡。

输入:

输入中有多组测试数据。每组测试数据包含3行,每行代表一个运动场。每行的格式为x y r,其中(x,y)为运动场中心的坐标,r为运动场的半径,-1000<=x,y<=1000,1<=r<=1000。所有数据均为正数,运动场互不相交(无公共点)且其中心点不在同一条直线上。

输出:

对每组测试数据,若存在最佳观察点,则在单独的一行里输出该点的坐标(保留6位小数),否则输出”No”。

样例输入:

0 0 10

60 0 10

30 30 10

样例输出:

30.000000 30.000000


三、选择题

1、假设X1X2是两个以0为均值,1为标准差的正态分布,那么X1+X2的概率密度分布是()

A、以0为均值,为标准差的正态分布

B、以0为均值,1为标准差的正态分布

C、以0为均值,2为标准差的正态分布

D、以0为均值,为标准差的正态分布

 

2、有两个样本点,第一个点为正样本,它的特征向量是(0,-1);第二个点为负样本,它的特征向量是(2,3)。从这两个样本组成的训练集构成线性SVM分类器的分类面方程是()

Ax - 2y = -3

Bx + 2y = 5

C2x - y = 0

D2x + y = 4

 

3、以下几种模型方法属于判别式模型(Discriminative Model)的有()

1)混合高斯模型

2)条件随机场模型

3)区分度训练

4)隐马尔科夫模型

A1,2      B1,4      C2,3      D3,4

 

4Native Bayes是一种特殊的Bayes分类器,特征变量是,类别标签是C。它的一个假定是()

A特征变量的各个维度是类别条件独立随机变量

B是高斯分布

C特征变量的各个维度是独立随机变量

D、各类别的先验概率P(C)是相等的

 

5、互信息(mutual information)是两个随机变量共有信息量的一个度量。随机变量X,Y有一下的联合分布p(x,y),请计算这两个变量的互信息()


A

B、其它选项均正确

C

D0

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值