想拿大厂Offer？这80道算法高频面试题别漏了。入职必备

最新推荐文章于 2024-04-23 03:11:35 发布

49.99%

最新推荐文章于 2024-04-23 03:11:35 发布

阅读量304

点赞数

分类专栏： python 文章标签： python

原文链接：https://cloud.tencent.com/developer/article/1659441

版权

python 专栏收录该内容

604 篇文章 21 订阅

订阅专栏

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理

以下文章来源于腾讯云作者：Python编程与实战

( 想要学习Python？Python学习交流群：1039649593，满足你的需求，资料都已经上传群文件流，可以自行下载！还有海量最新2020python学习资料。 )
在这里插入图片描述

我自从2015年担任算法组leader，作为面试官面试了不少同学。前前后后面试了超过200名同学，其中有不少入职的同学后来发展都不错，也坚定了自己对于选人标准的自信心。

今年2020年找工作尤其艰难，我把这些年作为面试官一些重要的面试题整理出来，一共80道，希望能够帮助到大家。

为了方便大家，我做了一个归类，一共分成了6大类，分别是：机器学习，特征工程，深度学习，NLP，CV，推荐系统。这些知识既是面试中的常见问题，也可以作为大家整理自己思路的参考资料。（需要的同学文末免费领取）

机器学习理论类：

在这里插入图片描述

写出全概率公式&贝叶斯公式
模型训练为什么要引入偏差(bias)和方差(variance)？证
CRF/朴素贝叶斯/EM/最大熵模型/马尔科夫随机场/混合高斯模型
如何解决过拟合问题？
One-hot的作用是什么？为什么不直接使用数字作为表示
决策树和随机森林的区别是什么？
朴素贝叶斯为什么“朴素naive”？
kmeans初始点除了随机选取之外的方法
LR明明是分类模型为什么叫回归
梯度下降如何并行化
LR中的L1/L2正则项是啥
简述决策树构建过程
解释Gini系数
决策树的优缺点
出现估计概率值为 0 怎么处理
随机森林的生成过程
介绍一下Boosting的思想
gbdt的中的tree是什么tree？有什么特征
xgboost对比gbdt/boosting Tree有了哪些方向上的优化
什么叫最优超平面
什么是支持向量
SVM如何解决多分类问题
核函数的作用是啥

特征工程类：
在这里插入图片描述

怎么去除DataFrame里的缺失值？
特征无量纲化的常见操作方法
如何对类别变量进行独热编码？
如何把“年龄”字段按照我们的阈值分段？
如何根据变量相关性画出热力图？
如何把分布修正为类正态分布？
怎么简单使用PCA来划分数据且可视化呢？
怎么简单使用LDA来划分数据且可视化呢？

深度学习类：

在这里插入图片描述

你觉得batch-normalization过程是什么样的
激活函数有什么用？常见的激活函数的区别是什么？
Softmax的原理是什么？有什么作用？
CNN的平移不变性是什么？如何实现的？
VGG，GoogleNet，ResNet等网络之间的区别是什么？
残差网络为什么能解决梯度消失的问题
LSTM为什么能解决梯度消失/爆炸的问题
Attention对比RNN和CNN，分别有哪点你觉得的优势
写出Attention的公式
Attention机制，里面的q,k,v分别代表什么
为什么self-attention可以替代seq2seq

自然语言处理（NLP）类：
在这里插入图片描述

GolVe的损失函数
为什么GolVe会用的相对比W2V少
层次softmax流程
负采样流程
怎么衡量学到的embedding的好坏
阐述CRF原理
详述LDA原理
LDA中的主题矩阵如何计算
LDA和Word2Vec区别？LDA和Doc2Vec区别
Bert的双向体现在什么地方
Bert的是怎样预训练的
在数据中随机选择 15% 的标记，其中80%被换位[mask]，10%不变、10%随机替换其他单词，原因是什么
为什么BERT有3个嵌入层，它们都是如何实现的
手写一个multi-head attention

推荐系统类：

在这里插入图片描述

DNN与DeepFM之间的区别
你在使用deepFM的时候是如何处理欠拟合和过拟合问题的
deepfm的embedding初始化有什么值得注意的地方吗
YoutubeNet 变长数据如何处理的
YouTubeNet如何避免百万量级的softmax问题的
推荐系统有哪些常见的评测指标？
MLR的原理是什么？做了哪些优化？

计算机视觉（CV）类：

在这里插入图片描述

常见的模型加速方法
目标检测里如何有效解决常见的前景少背景多的问题
目标检测里有什么情况是SSD、YOLOv3、Faster R-CNN等所不能解决的，假设网络拟合能力无限强
ROIPool和ROIAlign的区别
介绍常见的梯度下降优化方法
Detection你觉的还有哪些可做的点
mini-Batch SGD相对于GD有什么优点
人体姿态估计主流的两个做法是啥？简单介绍下
卷积的实现原理以及如何快速高效实现局部weight sharing的卷积操作方式
CycleGAN的生成效果为啥一般都是位置不变纹理变化，为啥不能产生不同位置的生成效果

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。