2018 阿里巴巴实习生内推面试总结(二面挂)

博主投了阿里巴巴的机器学习实习岗,无奈实在自身太菜,被挂掉了。然而我觉得我需要写下这段经历用来自我总结。

博主是华科某工科学院在读硕士,本科211,都是非CS专业。在牛客网上找人内推,方向是机器学习算法工程师。然而这哥们直接给我推到支付宝去了。。。。。。

然后完成简历后等了四五天,就约时间进行了第一轮面试。

第一轮面试问的是基础的数据解结构,题目是假设有一个巨大的网页,里面有众多词汇,现在已经对网页的词汇进行了分词。求如何随机获得网页中的k个词。题目不是很难,只不过博主没有反应过来。

刚开始我给出了个两次查找的方法,先遍历整个网页获得词数N,然后利用词数N生成K个词数0-N-1之间的随机数加入到集合中A,排序集合A,再次遍历这个网页,集合A中的元素对应词的Index,然后将对应索引的词取出来,返回。他讲这个要两次遍历,且k可能很大,时间复杂度开销有些高。让我一次遍历完成。我提出保存N个词,然后通过随机访问选择词汇,他讲这个空间复杂度过大。

最后我提出,用hash表保存N个词,其中共有p个不重复的词,统计这个p个词的词频。然后遍历hash表,累加词频,通过词频间隔来表示定位词汇。可以用二分查找树或者直接二分查找实现。然后就是写代码,在一个代码测试系统上。应该还有更好的算法,博主就想不到了。

大概又过了四五天,就约时间准备了第二轮面试。

这轮面试问的是项目。我这些还都没有准备,因为当时就是跟风投的简历,自己心里面还没b数,项目没什么技术含量,有两次天池大数据的比赛,基本上就是洗数据+XGBOOST,所以只能跟面试官尬聊。。。。。。最后问了一个问题,我还没有找到答案。对于一个图片检索引擎,有爬虫从网上获取图片,计算一个md5码,存储图片,然后该系统可以通过md5码获取到存储的图片,问这个系统如何设计。我最后给出了,用文件存储多个(10w个)图片的二进制码(按照图片加入顺序)。然后散列保存图片md5码和图片的加入顺序id,然后id找到文件,再从文件中找到图片的二进制数据,返回图片。最后我自己也觉得这样做挺不靠谱的,最后问问题的时候也就问了面试官,然后他跟我讲,这在facebook图片检索系统和非关系数据库中经常用到,回头我查到了再补吧。

然后最让我伤心的是,下午三点面完了。晚上回来更新面试状态就变成了 已回绝。。。。。。。这说明面试官挂了电话就把我挂了。。。。。。

从这次面试中我认识到了:第一,基础很重要,手写代码很正常。第二,项目经历要准备好,不要因为项目太简单或者什么的就略过,要从细节上去谈,不要陷入尬聊的窘境。第三,准备好机器学习的理论知识,很多东西背下来和真正理解还是不一样的。

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值