今天下午5点在天大东门对面的上岛咖啡进行了本人找工作以来的第一场面试。
面试官很nice,不过我还是有些紧张^_^。
面试进行了一个小时,面试官先让我说说自己做的项目,由于他对一个项目中的垃圾邮件文本比对算法很感兴趣,所以直接就从这里开始发问(是在我介绍项目的过程中发问,逐渐脱离项目):
1.你是不是对文本匹配领域比较熟悉?答:凑合
2.那你说说文本分类聚类?哑然(忘了)(简单地说:聚类--是“无监督学习”,事先不知道将要分成哪些类。分类--是“监督学习”,事先知道有哪些类别可以分。)
3.从10万规模的URL串中去重复?回答得不好,复杂度没达到要求。(我们需要对URL进行划分,分成几个部分(域名、一层地址、二层地址...),首先将域名hash到n个桶里,比较同一桶里的URL,如果相同,去除之
4.两个百万规模的数组(只有英文小写字母)找共同串
面试结果不好,我还须努力才行。
冷静地面对一切!