2014.4.4百度运维面试经验_百度运维工程师 4面-CSDN博客

本文链接：https://blog.csdn.net/Marelin/article/details/22933857

昨天下午百度打电话让我去面运维，但是我一想，我从来没投过运维，投的是研发和数据。确认是运维部门后我开始粗粗准备运维的东西。

今天上午10点我来到百度大厦A座，开始我的一面。一面的面试官长的高大帅气，具有亲和力。他问的问题大多是linux和shell编程。可惜我不会shell编程。然后又问了项目经历，讲的比较清楚，包括技术细节。算法方面，问了如何从含有多行URL的文件中，找出含有“新浪”字符的URL。我用了hashtable来实现，然后针对大数据可以用哈希映射到多个小文件中，然后从小文件中找到“新浪”的URL。最后，一面面试官问了如何将数据挖掘用在运维上面，可能是我对运维的了解不足，所以回答的是偏重于产品维护方面的，所以答的非常不好。于是，一面结束，大概用了50分钟。·很快接下来是二面，二面面试官也特别亲和。他问的第一个问题是项目中数据挖掘技术的具体细节，然后让我谈谈某一个感兴趣的方向，我说的是深度学习，正好最近在搞这方面的项目，所以答的还是非常不错的。算法方面问了3*4个格子，从开始走到结尾的路径有多少条。这个问题，我之前研究过，但是临场忘记怎么写了，只记得思路，于是，给面试官讲了思路。面试官给出运维方面的数据（包括服务器性能，定期维护等等），让我提出具体的实施方案。于是，我就开始了快速应答过程。大概20分钟的交流，这个问题才算结束。最后让我写了一个最熟悉的排序算法，我写了插入排序，然后面试官又问了跟冒泡的区别等等。二面花了1个多小时时间，结束时已经12点多了。

总结百度二面，我发现面试官问的细节特别多，但是都比较基础，所以只要认真刷题，多思考，是没有问题的。接下来就是安心等三面通知了。

面试题总结：

1.有一个很大很大的输入流，大到没有存储器可以将其存储下来，而且只输入一次，如何从这个输入流中随机取得 m 个记录。

回答：每次输入一个记录时，利用随机函数为这个记录分配一个随机数，然后利用这些随机数维护一个大小为 m 的堆。这不仅可以保证当输入的记录少于m时，这些记录都能被保存下来。而且，只需要维护一个大小为m的堆，实现起来十分简单。

2.大量的URL字符串，如何从中去除重复的，优化时间空间复杂度

利用hash%1000将大量字符串映射到1000个小文件中，然后从每个小文件中找到重复的去除，然后再合并