面试9.25

360 大数据开发
一面:
自我介绍
两段实习经历
家宽预测怎么做的,拓展问了决策树,cart用什么选择特征?(这个忘了,基尼系数)

机器学习选股,svm,adaboost。有没有上线之类的(没有,决策权不在我)

说了JD算法比赛,说了xgboost延伸到了gbdt,解释gbdt的原理。 (多棵树,拟合残差)
怎么验证模型的效果?(计算指标,F1的公式,召回率,准确率)

深度学习,CNN为什么不能解决异或的问题,(答不上来,00,01,10,11让用svm做,我说映射到高维空间找一个平面,又问怎么映射,我说核函数,差不多是的)

线性的算法,我说回归? 面试官让解释logistic回归。我说就是把一堆样本点拟合到一条曲线上面去,然后用最小二乘衡量拟合的好坏(他好像说有点问题?)
问hadoop vs spark优点?
隐约知道,但表达不出来,so直接说说不好。
(其实就是hadoop只有mapreduce两种操作,而且job之间的关系由开发者自己管理,比较麻烦)
估计自己的代码量
大概几万行之类的,吓到我了,不知道怎么答。就说最近的是JD的那个算法比赛,自己一个人写的。

应用题
100万个数据,求最大的k个
维护一个长度为k的最小堆。然后他应该知道我看过类似的题目就跳过了。
100万个用户,怎么找knn
我说要不聚类吧,(明显不赞同)。然后告诉我用索引,我依稀知道一点,就不纠结了,说答不上来。

编程题
a=[9,0,1,3,-2,8]
求j>i,max(a[j]-a[i])

我想了一会(有点尴尬),说用动态规划。然后就开始写,写完他说有点问题。
没有return(忘了,我以为说我逻辑有问题),又改了改,最后说思路是对的,但结果不对,自己回去改,时间到了。。。。最后自己改了。

二面:
比一面轻松一点,不那么揪着算法问了。
还是问项目。
家宽预测,怎么验证好坏,说没法验证,正负样本很不均匀。
又问怎么解决不均与,答(上采样,下采样),其实还有代价敏感。

问电信推荐的,怎么做?
我说没有数据,都是自己构造数据做的。没有历史数据也很难做推荐,面试官抬头想了想表示赞同。
然后又问具体怎么做的?我说用上网日志提取关键字和商户的关键字这些分别构造向量,然后求相似度,构建二维矩阵,协同过滤。。。也是很无语啦。

说比较常用python,那包是什么概念?
我说是本地project的文件目录导入的时候叫包,import dir1.dir2这种。
又问__init__.py文件是干啥的?
我说就是需要这个文件才能import,不然不会搜索这个路径,其实就是个空文件。

问基础
tcp三次握手四次挥手?为什么需要三次?
http://blog.csdn.net/xifeijian/article/details/12777187
“为了防止已失效的连接请求报文段突然又传送到了服务端,因而产生错误”
TCP连接时全双工的,因此,每个方向都必须要单独进行关闭

操作系统,write()操作把数据写入磁盘的过程??
答不上来,太底层了。我还以为他要考我文件锁,orz

手写代码
二叉树的高度–我用c++写的,问能不能递归,能就用递归两行搞定了。

问了数据挖掘这些算法是上课教的还是怎么?
我说上课就简单教了贝叶斯,决策树、关联规则这些。其他都是自学的。
又问未来职业规划?想做数据建模还是算法研究,我说数据建模吧,研究还不太行,需要积累,还有本书没看。面试官问是啥书?《统计学习方法》

三面:
HR面,给跪啊,没经验。先说自己的学习经历和实习经历,然后一上来就问自己最大的三个有点和最优成就感的事情。懵逼,不会夸自己啊。卒

问我有什么要问的?
我问为什么要问前面那些问题,他说优秀的人身上某些特质注定了他们的成功blablabla,我点头如捣蒜。。。
然后问我还有什么问题,我摇头说没了,say bye

事后感觉好方,没有介绍他们公司,没有谈岗位没有谈薪资,呜呜呜,我估计是跪了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值