[Alibaba] 校招二面面经

最新推荐文章于 2023-03-10 15:42:29 发布

原创最新推荐文章于 2023-03-10 15:42:29 发布 · 614 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#Alibaba #面经

ACM算法题目和总结专栏收录该内容

25 篇文章

订阅专栏

博主分享阿里巴巴面试经历。面试先围绕简历项目，聚焦NLP课题，询问深度学习知识及个人作用，还探讨朴素贝叶斯和Logistic回归。算法环节有两道题，涉及求特定质因子第K大数、找出未出现整数。Coding部分有找最大连续子序列和、找由其他单词组成的最长单词，后者用动态规划求解。

项目

先问了简历上面的项目，着重问了一个和本校研究生合作的一个NLP课题，因为是用深度学习做的，问了一些深度学习的基本知识，和自己对深度学习的理解。

然后问了一下我在项目中起的作用，我提到了通过复现其他paper来比较实验效果，然后面试官让我举一个复现论文的例子，我就给他讲了一个机器学习的例子，从word embedding到word2vec再到训练和测试过程，method方面我提到了朴素贝叶斯分类和Logistic回归。

然后面试官又让我讲讲对朴素贝叶斯分类和Logistic回归的理解。我就从算法的主要思想讲起，讲到了高斯分布的假设和最大似然估计法，随后又讲了如何从贝叶斯公式推出Logistic回归的公式，两个算法的统一性和差异性等等。

这部分大概面了二十分钟，我尽量把自己知道的每一个细节都讲清楚了，最后从情绪反馈上感觉面试官还是比较满意的。

算法

主要问了两个题

第一题

第一题比较简单，如何快速求出第 $K$ 大的数，满足其质因子只由3，5，7组成。

思路

这道题几乎是零思考秒杀了，中心思想是对 $K$ 进行三进制分解，随后三进制的三位0，1，2分别映射为3，5，7
按位加权计算后即可。

第二题

第二题稍微难了一点：
给定四十亿个无符号整型，生成一个没有出现在这四十亿个数里面的一个整数。

思路

首先一个显然思路是考虑二进制位。
从高位到低位枚举，比较当前位为1的整数个数和当前位为0的整数个数。
如果其中一个小，说明其中存在缺失的数
故直接循环地取即可。
时间复杂度 $O (n l o g n)$
空间复杂度 $O (1)$

然后考虑如何空间换时间
一个更直观的思路是直接桶排序
即定义一个非常大的数组 $v i s$

遍历每个数，假如当前这个数为 $x$ ，则 $v i s [x] = 1$
最后再遍历数组中的每一位 $i d$
若 $v i s [i d] = 0$
则输出 $i d$ 即为所求
时间复杂度 $O (n)$
空间复杂度 $O (n)$

这两个思路我都答到了，但面试官继续刁难了我qwq
如果我的空间只有 $100 M$ ，同时保证时间复杂度为 $O (n)$ 的情况下，如何提出一个更好的算法？

中间至少有3分钟我都在往位运算如异或等方向思考
但越想越复杂
最后面试官提示可以考虑分块
又想了一分钟后说出了最终的正解。

首先算一下，如果空间复杂度为 $O (n)$ 的情况下需要多少内存：(假设数组类型为 $b o o l$ )
$2^{32} * 1B = 4GB$
而如果要用 $100 M$ 的空间保存，则需要分成的块数为：
$\approx 2^{12}/2^{6} = 2^6 = 64$
而对于无符号整型，取值范围为： $0$ ~ $2^{32}-1$
故每一块的长度为：
$2^{32}/2^{6} =2^{26}$

大体解题过程如下：
首先第一次遍历将每个数映射到相应的块
开一个计数器数组cnt[64]
对于当前遍历的数 $x$ ，令 $cnt[x/2^{26}]$ ++
然后找到其中某个块 $k$ ，满足 $cnt[k] < 2^{26}$ ，则说明块 $k$ 存在缺失值。

随后再开一个 $b o o l$ 数组 $vis[2^{26}]$ ，占内存 $64 M B$
第二次遍历每一个数
对于当前遍历的数 $x$ ，如果 $x/2^{26} == k$
则令 $vis[x-k*2^{26}]=1$
最后遍历 $v i s$ 数组的每一位
找到值为0的某一位 $i d$
则最终答案为： $id + k*2^{26}$

此题最终就答完了（虽然思路很清楚，但感觉我面试答得很模糊…

Coding

Coding有两道题

第一题

找到最大连续子序列的和
这种送分题5行代码就秒杀了…

第二题

Write a program to find the longest word made of other words in a list of words

input : abc, def, gh, aldfldjldjf, abcdef, defgh
output : abcdef

想到了两种算法，先都给面试官口胡了一遍
问面试官需要我实现哪一种，还是全部实现
然后他让我实现动态规划的解法

思路很简单就不详细解释了

最后的代码如下：

map<string> mp;

bool cmp(string& x, string& y){
	return x.lenth() < y.lenth();
}

string getLongestWord(vector<string> wordList){
	mp.clear();	
    sort(wordList.begin(), wordList.end(), cmp);
	int n = wordList.size();
  	for (int i = 0; i < n; i++) {
    	mp[wordList[i]] = 1; 
    }
  	
  	string ans = "";
  	for (int i = 0; i < n; i++) {
    	int len = wordList[i].length();
      	bool flag = 0;
      	for (int j = 1; j < len; j++) {
        	string sub1 = wordList[i].substr(0, j);
          	string sub2 = wordList[i].substr(j, len - j);
          	if (mp[sub1] && mp[sub2]) {
            	flag = 1;
              	break;
            }
        }
    	if (flag) {
        	if (len > ans.length()) {
            	ans = wordList[i];
            }
        }
    }
  	return ans;
}