原创声明:本文由陈大大da 原创,转载请注明CSDN 原地址。
最近发现自己写的博客被抄袭,还没有注明我的出处,抄袭的那篇访问数还很高,我的心情很差,好像被偷了孩子,维权也没有地方维权,希望CSDN 或者其他人能管一管。最后,希望我的个人主页能够尽快建起来。
面试岗位
为了避免一些不必要的麻烦,我这里隐去了公司的名字,但是基本都是国内top 的互联网公司。
- 某科技公司 金融自然语言处理,机器学习,知识图谱岗位 挂
- 某打车公司 反欺诈数据分析挖掘岗位 挂
- 某教育公司 推荐算法岗位 挂(数据结构理论知识)
- 产品经理岗位 挂
- top3 互联网公司 数据挖掘机器学习岗位 挂
后续更新
- 某知名电商广告搜索岗位 挂 (数据结构)
- 某打车公司 算法岗 过
- top3 公司用户行为研究中心 过
- 某旅游公司 数据分析
10.某科技公司 机器学习算法岗
面试表现自我感觉很差,有些紧张了,主要是自己能力不足,之前是做数据分析的,现在转行做算法,确实也缺失很多东西。
金融自然语言处理 机器学习 知识图谱岗位
这个岗位是典型的应届生算法岗位一面的面试流程
流程如下
1. 自我介绍 2分钟
2. 问简历内容 及其详细
2.1 从项目问起,有一个在研究的知识图谱补全的项目,做了一些前期调研和代码复现的工作,是github 上练手的知识图谱项目, 非常简单,问我是怎么构建的,有几种关系,关系是如何提取,实体如何识别, 事件是如何识别,因为项目过于简单不涉及这些技术难题,我都回答的没有涉及到这些问题。复现了知识图谱的几篇推理文章TransE ,TransR ,问我为什么要做推理,这个论文的思路是什么,复现这些论文,对我们项目的研究有什么帮助,你们打算怎么做等等。
项目2是 MOOC 评价项目,项目的数据是如何获取的,项目实现的思路,具体的指标是什么,指标的来源是什么,依据是什么,为什么要选用这个指标 ,实现中用了PCA 降维,为什么要用PCA 降维 PCA 降维的原理,步骤,PCA 为什么能够实现保留最大化方差
接着问实习,为什么有个实习经历只有一个月,那个项目你主要负责什么做什么,
2 深度学习的基础模型
- 常用的激活函数 sigmoid relu tanh
- sigmoid 函数 和softmax 函数的区别 优劣
- 为什么sigmoid 函数会引起梯度爆炸
- CNN 原理
- RNN 原理
- RNN 你的实践是什么,我说用RNN 做音乐生成,问最后一层的输出是什么,我没准备忘了 我说忘了 KO
- CNN 与RNN 的区别 应用场景 优势劣势
- LSTM 原理 公式 架构 说清楚
- CNN 与LSTM 的区别
10.RNN 与LSTM 的区别 为什么LSTM 比RNN 好 回答长程记忆更长,问为什么长程记忆更长
3 数据结构
二叉树
链式结构
不太会 KO
4 数据算法实现
找出一个字符串列表中最长的字符串在列表中的位置以及长度 不会 KO
反欺诈数据分析挖掘岗位
本来这个面试是需要线上面试,进入到专业的面试系统当中,还需要写代码,但是我的面试系统一直打不开,HR 就只好电话裸面了
昨天晚上看了一些面试自我介绍的经验,自己的自我介绍说的不是很好,还需要补充自己针对这个岗位的优势
注意不要夸张自己的技能,如实说就好,我在自我介绍里说自己的专业是统计学机器学习方向,后边一直打脸。
数据挖掘岗位,问我关于一个数据挖掘项目的处理,在其中担任的角色,做了什么工作,从项目中收获了什么
这个问的比较短 一共10多分钟
这个指标我选的是 地理位置,长期在学校的大部分是未成年人,在这部分人当中,再次筛选 在工作日经常登录的人, 这类是校内的公职人员,另外 根据 他们在APP 中的点击行为,观察他们的兴趣,设计一些标签 00后必听 必看, 通过这些标签来筛选
建模的话,这是一个分类模型,可以用logistic 回归 和决策树回归
我觉得我回答的逻辑还可以,但是面试官一直问还有什么指标吗还有吗 问的我心理崩溃,
关于模型她提出了问题,因为数据没有标签 怎么解决数据没有标签,没有办法判断模型的优劣问题, 我刚开始想回答用迁移学习,但是想不到好的例子,于是我就说人为的创造标签,和去搜集一些实际的标签数据做正反例,通过negative sampling 进行半监督学习
emmmmm 自己对这个回答不满意,估计面试官也不满意
询问我的SQL 技能 和数据分布式存储有了解多少 我的SQL 学了一个星期,平时全靠谷歌和百度,显然这样是不行的
询问我,如何找到在一个月内登录两次及以上的用户 用户在3-1日登录过
我叙述的思路是,记录3-1日用户登录的id 列表1 取3-2 和 3-31日的用户id 列表2 如果list1 中的元素在list2 中出现过 则记录用户id
后来看了面试经验,这里我还应该问一下我面试的表现的,然而丝毫没有想到
推荐算法岗位
这部分我只在课堂上听过,虽然之前读过10几篇论文,但是面试前没准备都忘了,基本没答
-### 逻辑题
一个人走过一条固定长度的路 一定有一个东西会在他走的时候落下来,走慢点还是走快点
男用户的使用率升高,女用户的使用率升高,总用户的使用率怎么变化,跟男女比例有关,我说使用率升高,面试官一脸KO 的表情
找出A 列表中有B 列表中没有的元素 结果我 不会
- 布式系统spark HADOOP 也不会
- Python代码 module 中初始化的py文件是什么 我 回答的_init_.py 说我回答错误
结果 : KO
面试官是计算机专业的
这个面试对我是一种精神折磨与暴击 但是也学到了很多东西
Top3 互联网公司数据挖掘机器学习岗位
时长 :25 分钟左右
- 自我介绍(没有亮点)
- 询问专业 仔细的询问了我们的专业,因为我的专业确实很奇怪
- 询问简历 科研项目的代码量,代码实现,主要工作,
科研项目的实际应用场景,科研项目的创新点,科研项目的结果如何评价,结果好不好 - 数据分析项目: 模型如何构建,权重如何确定,模型效果如何,评价结果如何评价,
以及对应的代码量 - 实习经历,实习中代码量,实习的具体的工作,模型如何评价的,
- 数据结构知识怎么样 KO 其他面试后虽然看了一点,但是3天又面试又投简历,我真的看不完一本书 被数据结构再次KO
- C++ java 代码 能力 完全没有
- 最基本的排序算法 搜索算法都知道吗 算法复杂度知道吗 KO
广告搜索组岗位
产品经理岗面试对算法岗的一些启示
- 你对产品岗位是怎么理解的 (你对算法岗的看法是什么样的)
- 为什么要做产品经理岗 【这里面试官通常想让你讲一个亮瞎眼的故事】(类比就是你为什么要做算法岗),吸引你的地方是什么
- 你最近有成就感的事情是什么(算法岗:你做过的厉害的项目要主动介绍出来说清楚)
- 模拟实际工作的产品场景,24小时上线一个产品,应该有哪些流程。(如何快速的交付一个解决问题的算法)
比较喜欢面试官的一句话, - 任何岗位,只要用心,都会有知识输入。原本以为产品经理是输出比较多的工作,积极想需求,个人价值更大,算法只要了解需求满足需求就可以了,多的是输入需求,自己不需要想太多。
面试总结 及今后的发展方向
- 因为我之前做数据分析建模的工作比较多,用的是最基础的统计数据模型,所以想转行算法岗无异于以卵击石 压力还是很大,尤其是我去年两年都沉浸在数据分析的工作中,自己也不是很努力,所以说这样的面试结果也是自己deserved 。接着努力,坚定转行的方向 ,没有什么好抱怨的
- 我的优势在哪,网上的面试经验这么多,套路这么多,申请表白算法岗,用实力证明自己可以胜任的人这么多,我的特点是什么,仅仅是实力强是不够的,非科班出身的我,到底有什么优势可言,除了发展算法的实习之外。这是我今后重点需要发现和思考的地方。
- 论文方向,完成一篇论文是发现问题解决问题,展示自己创新能力和思考能力的完美证明
- 基础知识方向 非计算机科班转行 我的数据结构,算法,以及 C++ 和java hadoop spark 都
- 竞赛方向 主要是锻炼实际处理数据的能力,现实场景中没有像学术研究这么干净的数据
- 面试经验方向 面试经验是面试前最快速有效提高能力和面试表现得东西,还需要多学习套路,也需要多学习如何不在套路中迷失自我
- 知识图谱自然语言方向