算法面试题

识醉沉香

已于 2022-03-04 15:40:58 修改

阅读量138

点赞数

分类专栏：面试文章标签：算法

于 2021-02-13 19:46:29 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43283527/article/details/113801206

版权

面试专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1. 算法模型

kmeans 算法介绍，K值怎么确定以及改进算法
树模型
1. bagging 与boosting 的区别
2. GBDT原理及与RF的区别Random Forest
3. GBDT与LR的区别，并说说什么情景下GBDT不如LR
4. Xgboost与GBDT比较，特征并行化怎么做
5. XGBoost及LightGBM
6. 选择决策树做基分类器的原因？
7.CART树的原理，和ID3以及C4.5有什么区别，回归树与分类树有什么区别。
LSTM与GRU介绍及优化点。
反向传播的公式推导（及伪代码实现）
Word2Vec中两种方法以及负采样和层次softmax如何优化的。
常用的损失函数以及对应公式并说明它们的使用情况和优缺点，以及LR中为何不能使用平方损失
LR与线性回归的区别
i. 损失函数：线性回归使用平方损失函数，LR则用似然函数；
ii. LR是分类算法，线性回归是回归算法
生成模型与判别模型
LR为什么用极大似然估计，损失函数为什么是log损失函数（交叉熵）
LR 为什么使用sigmoid函数
为什么平方损失函数不适用分类问题
聚类算法 k-means 与 gmm 的差异与用途？
贝叶斯网络的原理
局部敏感哈希原理

2. 模型优化

ABtest 如何实现流量分流：样本的独立性和采样方式的无偏性。
优化器鞍点
激活函数：使用激活函数的目的就是为了向网络中加入非线性因素；加强网络的表达能力，解决线性模型无法解决的问题。
RNN容易产生梯度消失怎么解决，与LSTM的区别
过拟合和欠拟合，为什么正则化可以防止过拟合呢
反向传播的作用、目的、本质
梯度下降法中需要利用损失函数对所有的参数的梯度来寻找局部最小值点，而反向传播算法就是用于计算该梯度的具体方法，其本质是利用链式法则对每个参数求偏导。
梯度消失和梯度爆炸，以及有哪些解决方法
相似度计算有哪些。
推荐系统的评估方法
推荐系统中的多路召回，如何确定每一路的数量和总召回数量？
L1和L2正则化
batchNormalization的作用以及使用过程
推荐系统中Precession和recall怎么计算
推荐列表集合计算准确率，用户真实观看列表集合计算召回率
AUC与GAUC 以及 AUC计算公式和GAUC的计算公式
模型评估
AUC和Gauc解析
交叉熵函数与最大似然函数的关系和区别
如何理解推荐系统离线和线上auc和线上点击率不一致的问题？
时间复杂度O(1)的离散采样方法
MapReduce 解析1 解析2
机器学习之特征选择和特征抽取（降维）
在你的项目里你如何提高推荐的效果，怎么去评判推荐是否有效？
假设你做了一个机器学习模型上线了。每天业务部门产生很多数据，然后你的算法把这些数据进行收集，并制作成特征，然后通过机器学习算法进行预测。但是最近一个月你突然发现你的模型效果变差了很多。请写出你计划从哪些方面，运用何种数据分析或其他办法进行诊断。
用xgboost模型对特征重要性进行排序
histogram算法与 pre-sorted算法对比
2.5亿个整数找不重复的整数，内存无法一下存下这2.5亿个数，怎么做。
softmax 与二分类比有什么特点
进程线程的区别？进程和线程相比有什么好处？
如何构建user和item的特征？
推荐系统中如何做 User Embedding？
如何构建一个分布式机器学习框架？
说一下做一个推荐系统是如何从召回，粗排，精排最终推荐的？每一个环节需要注意哪些问题？
如何构建用户侧特征，如何理解静态和动态特征？
如何理解双塔模型中cosine similarity的计算？如何理解粗排和精排的不同需求？
当mapreduce任务中有一个reducer执行特别慢，该如何处理？
业务中，召回和粗排分别负责哪些任务？如何从海量item中一步一步选出推荐的item？
图的稀疏性问题
一个图中，顶点数 n 边数 m
当n^2>>m 时，我们称之为稀疏。
当m相对较大时，我们称之为稠密
word2vec对each word使用两个embedding的原因
word2vec的几点疑惑
Node2Vec得到embedding后计算出的距离不符合逻辑，关于推荐系统冷启动的问题
关于在线学习Online Learning的几个问题,深度模型排序效果差于按热度排序,有偏特征(连续型数据非正态分布->左偏or右偏)什么时候需要转正态分布？
W2V经过霍夫曼或者负采样之后，模型与原模型相比，是等价的还是相似的？
Word2Vec中为什么使用负采样？，负采样每次让一个训练样本仅仅更新一部分的权重，这样就好降低梯度下降过程中的计算量。
word2vec的损失函数
如何解决深度推荐系统中的Embedding冷启动问题？
推荐系统打压保送重排策略,不仅要知道模型能做什么，更要知道它不能什么。
召回粗排精排-级联漏斗
推荐系统相关的文章讲解
推荐模型中正负样本怎么选择，特别是负样本的选择？
推荐系统特征工程中的几个高级技巧
推荐系统中的特征工程
Focal Loss与GHM——解决样本不平衡利器
工业界推荐系统中有哪些召回策略？
推荐中的召回算法
推荐系统传统召回是怎么实现热门item的打压?
推荐系统中的attention机制
超长用户行为序列建模

3. 项目理解

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
算法面试题

1. 算法模型推荐系统中召回算法有哪些协同过滤（基于共现关系，基于模型）、内容召回和热点召回，标签召回。解析kmeans 算法介绍，K值怎么确定以及改进算法树模型1. bagging 与boosting 的区别2. GBDT原理及与RF的区别3. GBDT与LR的区别，并说说什么情景下GBDT不如LR4. Xgboost与GBDT比较，特征并行化怎么做5. lgb6. 选择决策树做基分类器的原因？7. ID3，c4.5 、cartLSTM与GRU介绍及优化点。反
复制链接

扫一扫

专栏目录

博客等级

码龄6年

44
原创

64
点赞

432
收藏

4701
粉丝

关注

私信

热门文章

分类专栏

linux 3篇
用户画像 1篇
特征工程 2篇
推荐系统 5篇
TensorFlow 7篇
用户增长
spark 2篇
scala 1篇
面试 1篇
Numpy 1篇
Pandas 1篇
python 2篇
matplotlib 1篇
算法 13篇

最新评论

Pandas基本操作教程
林北林奈: 1.1.1取列名集合中是否是df.colums.valus.tolist()?
正则匹配详解
shangliu0: {n，}的应用里面也是少了个“，”，应该为a{3，}
正则匹配详解
shangliu0: 重复限定符字符+，应用那边，ba+写成了ba*
leetcode回溯法
CSDN-Ada助手: 机器学习算法和传统的数据结构与算法有什么差异呢？
leetcode链表
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加条理清晰的目录；(3)使用标准目录。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。