2014.4.4百度运维面试经验

昨天下午百度打电话让我去面运维,但是我一想,我从来没投过运维,投的是研发和数据。确认是运维部门后我开始粗粗准备运维的东西。

今天上午10点我来到百度大厦A座,开始我的一面。一面的面试官长的高大帅气,具有亲和力。他问的问题大多是linux和shell编程。可惜我不会shell编程。然后又问了项目经历,讲的比较清楚,包括技术细节。算法方面,问了如何从含有多行URL的文件中,找出含有“新浪”字符的URL。我用了hashtable来实现,然后针对大数据可以用哈希映射到多个小文件中,然后从小文件中找到“新浪”的URL。最后,一面面试官问了如何将数据挖掘用在运维上面,可能是我对运维的了解不足,所以回答的是偏重于产品维护方面的,所以答的非常不好。于是,一面结束,大概用了50分钟。·很快接下来是二面,二面面试官也特别亲和。他问的第一个问题是项目中数据挖掘技术的具体细节,然后让我谈谈某一个感兴趣的方向,我说的是深度学习,正好最近在搞这方面的项目,所以答的还是非常不错的。算法方面问了3*4个格子,从开始走到结尾的路径有多少条。这个问题,我之前研究过,但是临场忘记怎么写了,只记得思路,于是,给面试官讲了思路。面试官给出运维方面的数据(包括服务器性能,定期维护等等),让我提出具体的实施方案。于是,我就开始了快速应答过程。大概20分钟的交流,这个问题才算结束。最后让我写了一个最熟悉的排序算法,我写了插入排序,然后面试官又问了跟冒泡的区别等等。二面花了1个多小时时间,结束时已经12点多了。

总结百度二面,我发现面试官问的细节特别多,但是都比较基础,所以只要认真刷题,多思考,是没有问题的。接下来就是安心等三面通知了。

面试题总结:

1.有一个很大很大的输入流,大到没有存储器可以将其存储下来,而且只输入一次,如何从 这个输入 流中随机取得 m 个记录。

回答: 每次输入一个记录时,利用随机函数为这个记录分配一个随机数,然后利用这些随机数维护一个大小为 m 的堆。这不仅可以保证当输入的记录少于m时,这些记录都能被保存下来。而且,只需要维护一个大小为m的堆,实现起来十分简单。

2.大量的URL字符串,如何从中去除重复的,优化时间空间复杂度

利用hash%1000将大量字符串映射到1000个小文件中,然后从每个小文件中找到重复的去除,然后再合并



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值