Intel因特尔 SSG大数据实习生面试

2018/3/11更:

星期四去面试了一下大数据实习生;以下是两个小时面试的问题,按回忆顺序,有兴趣的同学可以看一下,希望对你们有帮助

有两个师兄,一个师姐都在Intel了;内推了一下,针对他们情况和个人面试情况,总结一下Intel对实习生要求:

如果你面测试;1、Linux你需要玩的很溜,而不是一点简单的操作指令,shell脚本要会;Python在测试脚本里面很重要!

2、暑期应该是Intel招聘实习的高峰,缺人!我研一的时候也面过Intel测试,而且录用了,但是需要我每周去4天,我要做论文,所以没去成;

接下来是个人的面试问题:

1、根据简历问问题,Linux如何看端口是否被占用, ps -ef | grep -i 端口号    netstat -tunple|grep 端口号

2、Hadoop和Spark主要区别,谈谈你对Spark的理解

HADOOP用的是mapreduce,spark是RDD,容错率更高,速度上spark也会更快一些,因为MAPREDUCE的中间结果落地,保留在磁盘里面;而Spark放在了内存里面

3、谈谈对Python Pandas认识和个人代码量

Pandas 主要就是两个东西,Series和DataFrame,前者类似于一维数组、后者类似于二维数据,pandas经常用来读取、存储数据,用来做数据处理工作等等;而且切片功能是非常强大的!补充:Numpy主要是用来做数组运算

4、手写一下两个DataFrame列相加

处于严谨,应该问清楚一下是放在新的列上还是放在原始的某列上;面试官也没有细说

5、介绍一下再KAGGLE比赛上的东西和做法,还有论文的做法

主要讲了三点:1、针对KAGGLE比赛,讲了一下特征处理过程,算法选择,选择方法时考虑的优劣势等;然后分析了一下论文的整个过程,感觉面我的对这方面并不是太了解,然后讲了很久。。

6、数据库设计三大范式和事务四大准则

三大范式:1、保证字段的单元最小,2、保证字段与主键有关系  3、保证字段与主键是直接关系(非间接关系)

四大准则:1、孤立性、事务之间是隔离的  2、一致性、事务执行前后是一致的 3、原子性:事务是整体执行or不执行的,不会部分执行 4、持久性:事务执行之后,数据库发生的变化是持久的!

7、你使用过那些Linux指令:

PS -ef:看进程     kill:杀死进程    cd cd..:进入路径和返回上一层路径  grep:正则匹配  ssh:远程连接

scp:与服务器之间的数据传输   mv:文件移动  cp:复制拷贝   vim、touch:创建文本   mkdir:创建文件夹

rm:删除文件or文件夹,看参数;unzip:解压  tar:打包或者解包。。 等等,基本的没啥问题,但是面试官觉得太low了 

8:主管进来了,然后就是聊天;然后推荐我去看看最近研发的芯片,对我有帮助,我过几天会去学习一下的!然后让我回去等通知,十几个里面要两个

从高中一直聊到研究生,各种聊天,其实就是对你的信息挖掘,大家面试别紧张,多面几次吧,抗压很重要,每次两个小时,来几次你就会收获很多的!

希望对你们有帮助!

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值