网易数据挖掘笔试题

 

第一部分 填选题

(选择题全都是不定项选择)

1. e1, e2, e3, e4按顺序依次入栈,以下可能的出栈顺序有()

A. e2, e3, e4, e1

B. e1, e2, e4, e3

C. e3, e2, e4, e1

D. e2, e4, e3, e1

ABCD


2. 运算式X=A+B*(C-D)/E可能的后缀表达式()

A. XABCDE/-*+=

B. XABC-DE/*+=

C. XABCD-*E/+=

D. XAB+CD/E-*=

画出表达式树然后后序遍历(*和+可交换左右子树),只有C满足


3. 非稳定排序有()

A. 冒泡排序 B归并排序 C快速排序 D堆排序 E希尔排序

冒泡是稳定的,归并无需交换也是稳定的,快牌需要非相邻交换不稳定,堆排是选择排序的变种也需要非相邻交换不稳定,希尔的不同插入排序过程中元素可能被交换也是不稳定的,答案CDE。


4. 一个有n个结点的四叉树,每一个结点都有4个指向子节点的指针,问有多少个空指针_______。

答:初始1个结点,4个空指针,每多1个结点则多3个空指针。4+3*(n-1)=3n+1


5. 一个函数,求运行结果

  1. int func(int i)  
  2. {  
  3. unsigned int temp = i;  
  4. temp = (temp & 0x55555555) + (temp & 0xaaaaaaaa)>>1);  
  5. temp = (temp & 0x33333333) + (temp & 0xcccccccc)>>2);  
  6. temp = (temp & 0x0f0f0f0f) + (temp & 0xf0f0f0f0)>>4);  
  7. temp = (temp & 0xff00ff) + (temp & 0xff00ff00)>>8);  
  8. temp = (temp & 0xffff) + (temp & 0xffff0000)>>16);  
  9. return temp;  
  10. }  
int func(int i)
{
unsigned int temp = i;
temp = (temp & 0x55555555) + (temp & 0xaaaaaaaa)>>1);
temp = (temp & 0x33333333) + (temp & 0xcccccccc)>>2);
temp = (temp & 0x0f0f0f0f) + (temp & 0xf0f0f0f0)>>4);
temp = (temp & 0xff00ff) + (temp & 0xff00ff00)>>8);
temp = (temp & 0xffff) + (temp & 0xffff0000)>>16);
return temp;
}
问func(0x7f530829)输出多少()

A15 B16 C17 D18

函数实现的是二进制下1的个数,一共15个选A。


6. 进程和线程的区别()

A. 操作系统只能调度进程,不能调度线程

B. 线程可以共享内存地址空间,进程不能

C. 线程可以共享内存数据,进程不能

D. 进程可以用IPC进行通信,线程不行

操作系统可以调度线程;进程可以通过共享内存进行通信;进程的进程间通信IPC不一定适用于线程(关于进程线程通信,可以看看wonder的这篇总结http://blog.csdn.net/wonderwander6642/article/details/8008241)。答案D。


7. 关于段页式管理,哪个说法是正确的()

A. 每个进程一个段表,一个页表

B. 每个进程一个段,一个页

C. 每个进程一个段表,每段一个页表

D. 每个进程一个页表

为实现段页式存储管理,系统应为每个进程设置一个段表,包括每段的段号,该段的页表始址和页表长度。每个段有自己的页表,记录段中的每一页的页号和存放在主存中的物理块号。C


8. 关于TCP协议,哪个说法是错误的()

A. 当连接关闭过程中,两端socket都要经过TIME_WAIT状态

B. 一个established的TCP连接,shutdown可以让主动调用端进入半关闭

C. TCP协议默认保证了当一端崩溃,另一端能自动检测失效

D. 只有established的连接可以收发信息,其他都不能

主动关闭的Socket端会进入TIME_WAIT状态,并且持续2MSL(maximum segment lifetime最大分节生命期)时间长度;

举个例子,说明客户端shutdown关闭socket过程:客户端调用shutdown,客户端向服务器发送了FIN,服务器确认ACK,然后发送完tcp对列中的数据PSH ACK,客户端确认ACK,然后向客户端发送FIN标志,客户端确认ACK。与closesocket关闭连接不同,shutdown关闭了发送数据通道,而没有关闭接收数据通道,因此主动调用端近日半关闭;

对于每个TCP连接,TCP管理4个不同的定时器。
(1)重传定时器用于当希望收到另一端的确认。
(2)坚持定时器使窗口大小信息保持不断流动,即使另一端关闭了其接收窗口。
(3)保活定时器可检测到一个空闲连接的另一端何时崩溃或重启。
(4) 2MSL定时器测量一个连接处于TIME_WAIT状态的时间。

答案A


9. 关于主键Primary Key和索引index,以下说法错误的有()

A. 唯一索引列允许为NULL

B. 一个关系表中的外键必为另一表的主键

C. 一个关系表只能有一个唯一性索引

D. 索引只用于查询操作,对插入操作影响不大

如果某列有多行包含 NULL 值,则不能在该列上创建唯一索引。同样,如果列的组合中有多行包含 NULL 值,则不能在多个列上创建唯一索引。在创建索引时,这些被视为重复的值。而主键的值不可重复,也不可为空(NULL)。

 

主键

外键

索引

定义:

唯一标识一条记录,不能有重复的,不允许为空

表的外键是另一表的主键外键可以有重复的可以是空值

该字段没有重复值,但可以有一个空值

作用:

用来保证数据完整性

用来和其他表建立联系用的

是提高查询排序的速度

个数:

主键只能有一个

一个表可以有多个外键

一个表可以有多个惟一索引

错误的有C


10. 数据库中事务隔离分为4个级别,其中允许“不可重复读”的有()

A. SERIALIZABLE 

B. READ COMMITTED

C. READ UNCOMMITTED

D. REPEATABLE READ

事务的隔离级别,从级别低到高依次为:

READ UNCOMMITTED 幻像读、不可重复读和脏读都允许。111
READ COMMITTED 允许幻像读、不可重复读,但不允许脏读。110
REPEATABLE READ 允许幻像读,但不允许不可重复读和脏读。InnoDB默认级别。100
SERIALIZABLE 幻像读、不可重复读和脏读都不允许。000

关于脏读,不可重复读,幻象读定义可以参阅http://blog.csdn.net/memray/article/details/8051893

答案BC


11. 如果F(n)表示数列的第n项,其中定义如下

F(1)=1, F(2)=2, F(n)=F(n-1)+F(n-2) (n>=3)

请写出一个函数求解F(n),并列出运算复杂度,要求运算复杂度小于O(n^2)。

答:编程实现题,只要不用F(n){F(n)=F(n-1)+F(n-2);}这种暴力递归就行(复杂度O(2^n))就行。


第二部分 专业知识(简答题)

1. 数据预处理在数据挖掘中是一个重要的步骤,请你谈谈你对数据预处理的理解

2. 请说出你对中文分词的理解,并谈谈它的难点和切分算法

3. 请列举并说明几个知名的分类算法

4. 请阐述K-均值聚类算法

5. 如果设计一个商品推荐系统,请谈谈你的思路

6. 请你谈谈你对观点挖掘的理解

网易互联网产品类笔试基础题还是比较细节的,有些知识点忘记了就有点答不上来。数据挖掘岗位的专业题比较专一点,没有学过数据挖掘背景的同学可能比较吃亏。

欢迎大家多多讨论吧~

### 回答1: 网易数据分析师笔试题是什么? 根据题目描述来看,可能是一道针对数据分析领域的题目,要求应聘者使用编程语言或数据分析工具进行数据处理、分析和可视化等操作。 笔试题可能会考察应聘者对数据预处理、数据分析和数据可视化的能力。在这个过程中,应聘者需要运用统计学、数据挖掘、机器学习等相关方法,对原始数据进行清洗、探索和分析,最终得出有意义的结论。 在回答这个问题时,可以从以下几个方面进行回答: 首先,应聘者可以介绍自己在数据分析领域的经验和能力。比如,自己是否具备数据分析相关的学历、培训或工作经验,擅长的编程语言、数据分析工具等。 其次,应聘者可以总结一下数据分析的过程。比如,数据预处理、特征选择、模型构建和评估等。 接着,应聘者可以谈谈自己在数据分析过程中常用的编程语言与工具,比如Python语言和数据分析工具如Pandas、NumPy和Scikit-learn等。 然后,应聘者可以详细描述一下自己在数据预处理、数据分析和数据可视化方面的经验。可以通过举例子,介绍一些在实际项目中采用的方法和技巧。 最后,应聘者可以简要说明一下自己未来在数据分析领域的规划和目标,比如希望深入学习机器学习算法或者数据可视化技术等。 通过以上的回答,可以展示出自己对数据分析领域的了解和热情,同时也能体现出自己的能力和潜力。 ### 回答2: CSDN是中国最大的IT技术专业社区,汇聚了众多的软件开发者、数据分析师、系统架构师等技术人员。网易作为中国的著名互联网公司之一,与CSDN合作也非常频繁。 网易数据分析师笔试题是指网易针对数据分析师岗位候选人举行的笔试。此笔试主要考察应聘者在数据处理、统计分析、数据报告撰写等方面的能力。 笔试题中可能包含以下内容: 1. 数据处理:要求应聘者掌握数据清洗、数据整合等技巧,能够合理地对大量的数据进行加工与整理。 2. 统计分析:要求应聘者具备一定的统计学基础,能够使用统计学方法进行数据分析,包括描述性统计、推断统计等。 3. 数据建模:要求应聘者能够基于已有数据进行建模分析,深入挖掘数据背后的规律和信息。 4. 数据报告撰写:要求应聘者能够将分析结果清晰地呈现出来,撰写具有合理结构和逻辑性的数据报告。 对于参加网易数据分析师笔试的候选人来说,最重要的是要具备良好的基础知识和实际操作能力。此外,还需培养自己的逻辑思维和问题解决能力。对于CSDN网站的应聘者来说,他们可以通过学习和参与网站上的技术讨论、项目实践等方式,不断提升自己的技术水平和经验。 总之,网易数据分析师笔试题是对应聘者数据分析能力和技术实力的考核,候选人需要在学习基础知识的基础上,进行实际操作训练,并通过各种途径积累经验,提升自己的能力。 ### 回答3: CSDN是中国领先的IT技术社区,致力于推动技术行业的发展和传播,为广大开发者提供学习、交流和分享的平台。而网易是中国领先的综合互联网技术公司,拥有丰富的数据资源和庞大的用户群体。 作为网易数据分析师,笔试题可能涉及数据分析的基本概念、数据处理技术和数据挖掘方法等方面。在这道题中,我会将网易作为数据分析的对象进行分析。 首先,作为一家综合性互联网公司,网易拥有大量的用户行为数据、产品销售数据和广告投放数据等等。数据分析师可以通过对这些数据的收集、整理和分析,帮助网易公司了解用户的偏好、产品的销售情况以及广告投放的效果。通过对这些数据的深入挖掘和分析,可以为网易提供决策支持和业务优化的建议。 其次,数据分析师可以利用数据分析工具和技术,对网易的业务进行更细致的划分和评估。例如,可以通过用户分群和用户画像的方法,对不同用户群体的行为和偏好进行分析,从而为网易提供个性化推荐和精准广告投放。此外,数据分析师还可以使用数据挖掘和机器学习的方法,寻找隐藏在数据背后的规律和模式,进一步提升网易的产品和服务。 最后,数据分析师需要具备良好的数据分析能力和业务理解能力。同时,也需要具备较强的沟通能力,能够将复杂的数据分析结果以简明的方式传达给相关部门和决策者。通过有效的沟通和交流,可以促进数据驱动的决策,提高网易的竞争力和市场地位。 综上所述,作为网易数据分析师,需要从数据收集、整理和分析的角度,为网易提供决策支持和业务优化的建议。通过数据分析工具和技术,对网易的业务进行更细致的划分和评估。同时,也需要具备良好的数据分析能力和业务理解能力,并具备较强的沟通能力。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值