4月22日-5月7日腾讯nlp算法实习面试题14道

最新推荐文章于 2024-07-31 11:44:59 发布

niuyunpang

最新推荐文章于 2024-07-31 11:44:59 发布

阅读量414

点赞数

文章标签：人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/niuyunpang/article/details/117708089

版权

本文整理了腾讯nlp算法实习面试的14道题目，涉及决策树种类及其损失函数、剪枝策略、信息增益比、XdeepFM与DeepFM的比较、Bert长文本训练方法、k-means原理、逻辑回归处理非线性数据、核方法求导、参数更新方法、Wide&Deep模型介绍、Xgboost、lightGBM和Catboost的异同，以及处理大数据文件的策略。

摘要由CSDN通过智能技术生成

问题1：决策树有多少种，分别的损失函数是什么？

决策树有多少种，分别的损失函数是什么?决策树有三种:分别为ID3，C4.5，Cart树

ID3损失函数︰
在这里插入图片描述

C4.5损失函数∶
在这里插入图片描述
Cart树损失函数∶

问题2：决策树的两种剪枝策略分别是什么？

决策树的剪枝基本策略有预剪枝(Pre-Pruning)和后剪枝(Post-Pruning)。

预剪枝核心思想︰

在每一次实际对结点进行进一步划分之前，先采用验证集的数据来验证如果划分是否能提高划分的准确性。如果不能，就把结点标记为叶结点并退出进一步划分﹔如果可以就继续递归生成节点。

后剪枝核心思想︰

后剪枝则是先从训练集生成一颗完整的决策树，然后自底向上地对非叶结点进行考察，若将该结点对应的子树替换为叶结点能带来泛化性能提升，则将该子树替换为叶结点。

问题3：信息增益比跟信息增益相比，优势是什么？

以信息增益作为划分训练集的特征选取方案，存在偏向于选取值较多的特征的问题。信息增益比可以解决该问题。

问题4：介绍XdeepFM算法，XdeepFM跟DeepFM算法相比，优势是什么？

在这里插入图片描述

上图为xDeepFM的总体结构，有三个分支:Linear(稀疏的01向量作为输入)、DNN(经过embedding的稠密向量作为输入)、CIN（压缩感知层)。

xDeepFM如果去掉CIN分支，就等同于Wide & Deep。

xDeepFM将基于Field的vector-wise思想引入Cross，并且保留了Cross的优势，模型结构也很elegant，实验效果也提升明显。

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。