本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理
以下文章来源于腾讯云 作者:Python编程与实战
( 想要学习Python?Python学习交流群:1039649593,满足你的需求,资料都已经上传群文件流,可以自行下载!还有海量最新2020python学习资料。 )
我自从2015年担任算法组leader,作为面试官面试了不少同学。前前后后面试了超过200名同学,其中有不少入职的同学后来发展都不错,也坚定了自己对于选人标准的自信心。
今年2020年找工作尤其艰难,我把这些年作为面试官一些重要的面试题整理出来,一共80道,希望能够帮助到大家。
为了方便大家,我做了一个归类,一共分成了6大类,分别是:机器学习,特征工程,深度学习,NLP,CV,推荐系统。这些知识既是面试中的常见问题,也可以作为大家整理自己思路的参考资料。(需要的同学文末免费领取)
机器学习理论类:
-
写出全概率公式&贝叶斯公式
-
模型训练为什么要引入偏差(bias)和方差(variance)? 证
-
CRF/朴素贝叶斯/EM/最大熵模型/马尔科夫随机场/混合高斯模型
-
如何解决过拟合问题?
-
One-hot的作用是什么?为什么不直接使用数字作为表示
-
决策树和随机森林的区别是什么?
-
朴素贝叶斯为什么“朴素naive”?
-
kmeans初始点除了随机选取之外的方法
-
LR明明是分类模型为什么叫回归
-
梯度下降如何并行化
-
LR中的L1/L2正则项是啥
-
简述决策树构建过程
-
解释Gini系数
-
决策树的优缺点
-
出现估计概率值为 0 怎么处理
-
随机森林的生成过程
-
介绍一下Boosting的思想
-
gbdt的中的tree是什么tree?有什么特征
-
xgboost对比gbdt/boosting Tree有了哪些方向上的优化
-
什么叫最优超平面
-
什么是支持向量
-
SVM如何解决多分类问题
-
核函数的作用是啥
特征工程类:
-
怎么去除DataFrame里的缺失值?
-
特征无量纲化的常见操作方法
-
如何对类别变量进行独热编码?
-
如何把“年龄”字段按照我们的阈值分段?
-
如何根据变量相关性画出热力图?
-
如何把分布修正为类正态分布?
-
怎么简单使用PCA来划分数据且可视化呢?
-
怎么简单使用LDA来划分数据且可视化呢?
深度学习类:
-
你觉得batch-normalization过程是什么样的
-
激活函数有什么用?常见的激活函数的区别是什么?
-
Softmax的原理是什么?有什么作用?
CNN的平移不变性是什么?如何实现的? -
VGG,GoogleNet,ResNet等网络之间的区别是什么?
-
残差网络为什么能解决梯度消失的问题
-
LSTM为什么能解决梯度消失/爆炸的问题
-
Attention对比RNN和CNN,分别有哪点你觉得的优势
-
写出Attention的公式
-
Attention机制,里面的q,k,v分别代表什么
-
为什么self-attention可以替代seq2seq
自然语言处理(NLP)类:
-
GolVe的损失函数
-
为什么GolVe会用的相对比W2V少
-
层次softmax流程
-
负采样流程
-
怎么衡量学到的embedding的好坏
-
阐述CRF原理
-
详述LDA原理
-
LDA中的主题矩阵如何计算
-
LDA和Word2Vec区别?LDA和Doc2Vec区别
-
Bert的双向体现在什么地方
-
Bert的是怎样预训练的
-
在数据中随机选择 15% 的标记,其中80%被换位[mask],10%不变、10%随机替换其他单词,原因是什么
-
为什么BERT有3个嵌入层,它们都是如何实现的
-
手写一个multi-head attention
推荐系统类:
-
DNN与DeepFM之间的区别
-
你在使用deepFM的时候是如何处理欠拟合和过拟合问题的
-
deepfm的embedding初始化有什么值得注意的地方吗
-
YoutubeNet 变长数据如何处理的
-
YouTubeNet如何避免百万量级的softmax问题的
-
推荐系统有哪些常见的评测指标?
-
MLR的原理是什么?做了哪些优化?
计算机视觉(CV)类:
-
常见的模型加速方法
-
目标检测里如何有效解决常见的前景少背景多的问题
-
目标检测里有什么情况是SSD、YOLOv3、Faster R-CNN等所不能解决的,假设网络拟合能力无限强
-
ROIPool和ROIAlign的区别
-
介绍常见的梯度下降优化方法
-
Detection你觉的还有哪些可做的点
-
mini-Batch SGD相对于GD有什么优点
-
人体姿态估计主流的两个做法是啥?简单介绍下
-
卷积的实现原理以及如何快速高效实现局部weight sharing的卷积操作方式
-
CycleGAN的生成效果为啥一般都是位置不变纹理变化,为啥不能产生不同位置的生成效果