[百度面试] 2015百度校园招聘研发类一面二面经验分享(面试时间:2014-09-25)

今天去面试百度了,一面感觉比较简单,百分之九十多都答上来了。坐下来面试的时候我看到了桌上我的笔试试卷,瞄到了分数,我擦,44分,这还能过笔试!然后等会有看到其他两张笔试卷,一张29分一张33分。。看来笔试给分是严格来给的。

      面试官先让我做自我介绍。然后马上就谈项目了,叫我挑一个项目讲讲怎么做的,解决了什么问题。问项目我最不怕了,毕竟项目都是自己认真地完成的,也确实在做项目过程中学到了很多东西,解决了一些问题。

然后就问问我在华为实习的情况。

说完他让我写写程序,问我知道哪些排序算法,叫我写一个熟悉的排序算法。居然让我自己选择,那果断快速排序啊。如下:

  1. void quick_sort(int array[], int begin, int end)
  2. {
  3.         if(end > begin)
  4.         {
  5.                 int pivot = begin;
  6.                 int last_small = begin;
  7.                 int i = end;
  8.                 while(last_small != i)
  9.                 {
  10.                         if(array[i] <= array[pivot])
  11.                         {
  12.                                 int temp = array[i];
  13.                                 array[i] = array[++last_small];
  14.                                 array[last_small] = temp;
  15.                         }
  16.                         else
  17.                                 i--;
  18.                 }
  19.                 int tmp = array[pivot];
  20.                 array[pivot] = array[last_small];
  21.                 array[last_small] = tmp;
  22.                 quick_sort(array, begin, last_small - 1);
  23.                 quick_sort(array, last_small + 1, end);
  24.         }
  25. }
复制代码

然后叫我写反转链表。。太经常问了这问题。但他一开始说不允许另外开辟地址,我还以为临时变量都不让声明,我就说这有点难。但是过一会他纠正了,临时变量是可以的。

  1. void reversal(listNode* head)//reverse the list
  2.         {
  3.                 listNode* before = NULL;
  4.                 listNode *current = head;
  5.                 listNode *temp = head;
  6.                 while(current != NULL)
  7.                 {
  8.                         listNode* next = current->next;
  9.                         current->next = before;
  10.                         before = current;
  11.                         current = next;
  12.                 }
  13.                 head = before;
  14.         }
复制代码

问:在已排序好的数组找两个数a+b等于给定的N。

对于一个数组array,长度为size,令begin = 0,end = size - 1,判断array[begin] + array[end] 与n的大小关系,如果相等,则找到;如果小于,则begin++,如果大于,则end--,然后继续做前面判断。这样基本上效率能最快了,因为是O(n)。

问:不用第三个参数调换整数a和b

他问了之后我就说这题我会,说真的,这题要是之前不知道,要在面试的时候想出来基本不可能。要用异或操作符来做:

  1. a = a^b;
  2. b = a^b;
  3. a = a^b;
复制代码

然后用a= 101,b = 111测试了一下,根据上面操作a = 010;b = 101; a = 111正确。


问:堆栈区别

说了一下四点:

1)栈是连续的,堆是不连续的;2)栈元素自动释放,堆元素要手动释放;3)栈从高地址开始存储向下增长,堆相反;4)存储读取效率上栈比堆快。

还问通常什么存储在栈中,答函数参数、局部变量等。

接下来他看了我的笔试题试卷,主要是讨论最后一道题:如下


情景:新浪微博发布内容要求字符不超过140,但是用户如果在发布内容中有很长的url时,会认为是很多字符。所以新浪上发布内容包含一个URL时,时把他压缩成一个TinyURL(缩小)。比如:

输入:http://zhidao.baidu.com/search?c ... e=utf-8&fr=wwwt

实际显示:http://asdfa.cn/ak78ss。(这里我只是随便举了个例子)

前面asdfa.cn是对应域名 zhidao.baidu.com,后面长长的字符串被压缩成ak78ss。

现在让你来设计TinyURL的实现,一下问题要怎么设计:

问题一:域名后面的编码如何实现?

问题二:对于已经映射过的一个URL,怎么查找已存在的TinyUrl?

问题三:有10亿个url,一个服务上存不下,需要多台服务器,怎么设计实现?

问了一个问题,说你觉得让你来设计这样一个服务,最大的问题是什么?我说是tinyurl的hash表存储,因为数据量真的非常大。他问那你要怎么存储,我说要用二次哈希吧,先根据hash值存储到对应的服务器上面,再进行hash存储。

接着他问我试卷上memcpy怎么没写?我说我当时对这个函数不了解。他叫我现在做一下这个题。我就不贴代码了,写得太烂,他说要在复制的时候考虑内存溢出问题。有兴趣的可以网上找实现代码。


后面是一道概率问题,一个山区的村子,生孩子直到生了一个男孩为止。题目就不多说了,网上不久有这道原题么?但我之前根本没看答案。所以我一开始在纸上一个劲地计算,最后发现计算不出来之后,我给了他这样的答案,说我觉得是1:1。为什么?因为生男生女概率本来就都是二分之一,无论定义怎么的规则生孩子,生男生女概率就是不会变,所以数量多了之后男女比例是1:1。我不知道他是否想要这样的答案,但我觉得我当时挺机智的。他说原理是什么呢?我说,当数量足够大的时候,概率比就是数量比。随后他爽快地说:去二面吧!


二面基本就是在考算法和数学了!总共四到题目:

一   写程序实现十进制转n进制,返回值类型自己定义。我就实现 了一个 string result(int m, int n)//m表示十进制数,n表示进制数。现场写的代码不完整,回来再完善了下:

  1. #include<iostream>
  2. #include<string>
  3. #include<stack>
  4. using namespace std;
  5. string transform(int n, int m)
  6. {
  7.         stack<char> s;
  8.         bool negative;
  9.         if(n < 0)
  10.         {
  11.                 negative = true;
  12.                 n = 0 - n;
  13.         }
  14.         else negative = false;
  15.         while(n != 0)
  16.         {
  17.                 char tmp;
  18.                 int mod = n % m;
  19.                 if(mod > 9)
  20.                         tmp = 'A' + mod - 10;
  21.                 else tmp = '0' + mod;
  22.                 s.push(tmp);
  23.                 n /= m;
  24.         }
  25.         int index = 0;
  26.         int len = s.size();
  27.         if(negative)
  28.                 ++len;//为负数,加负号
  29.         string result('1', len);
  30.         if(negative)
  31.                 result[index++] = '-';
  32.         while(!s.empty())
  33.         {
  34.                 result[index++] = s.top();
  35.                 s.pop();
  36.         }
  37.         return result.substr(0, len);
  38. }
复制代码

二  一个数组由a,b,c,d,e五个字符组成,设计一种算法找出一个包含这五种字符的最小区间,数组是循环的,也就是可以有这样的区间(9,2)

    因为要包含五个字符,所以最小区间长度是5。所以我最开始想到的就是让区别数从5开始往上递增,对于每一个区间数比如5,遍历数组的所有区间,判断是否包含5个字符,是的话就刚好找到了最小区间。然后这复杂度算了一下是O(n^3)了,接着在面试官的指导下我优化到了O(n^2)。他说其实最优的可以O(n),不过能优化到O(n^2)已经不错了。

三  概率题

有四种颜料,给下面8个方格填色,每相邻两个不能用同一种颜色,有多少种填色方法?

  

想了一下,挺简单的,就是4 * 3^7。然后他加了条件,首尾也不能用同种颜色。他这样加条件后我想了很久,中间也说了我的逻辑,我觉得没挺严谨的,但就是错误。最后没能想出正确答案。



四  也是一道在网上看到过的题目,但就是之前没去看答案,也没思考过。

百度hi有个日志文件存了用户的上线时间和下线时间,格式为  userid      hh:mm::ss(上线)   hh:mm:ss(下线),一行一条数据。问,如何统计一天内每一秒在线的用户数量。数据量100w。

我最终是想出了复杂度 大概在100w*40左右的算法,他好像也比较满意,但说最优可以到100W加一个常数。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值