AI面试题

最新推荐文章于 2025-02-15 18:19:15 发布

傲慢与偏见·

最新推荐文章于 2025-02-15 18:19:15 发布

阅读量3.4k

点赞数 4

分类专栏： AI 文章标签：人工智能

本文链接：https://blog.csdn.net/Q632655672/article/details/109627416

版权

本文整理了AI面试中常见的数据处理、模型选择、过拟合与欠拟合、集成学习等多个领域的70个问题，涵盖了从特征归一化、距离度量到随机森林、GBDT、XGBoost等模型的深入探讨，以及SVM、K-means等算法的原理和应用。通过这些问题，可以全面了解和提升AI技术面试的准备水平。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数据分析案例https://zhuanlan.zhihu.com/p/136975705?from_voters_page=true
在这里插入图片描述

1.为什么要对特征做归一化（理解清楚特征归一化所适用的模型场景）
在这里插入图片描述

2.什么是组合特征？如何处理高维组合特征？（这里的特征组合主要指的是类别特征(Categorical Feature)之间的组合）
在这里插入图片描述

3.请比较欧式距离与曼哈顿距离？（比较曼哈顿距离和欧式距离的数值特点，并结合一两个具体例子做分析）
在这里插入图片描述

4.为什么一些场景中使用余弦相似度而不是欧式距离（比较余弦相似度和欧式距离的数值特点，并结合一两个具体例子做分析）
在这里插入图片描述

5One-hot的作用是什么？为什么不直接使用数字作为表示（理解清楚并比较One-hot编码和数字编码的特点）
One-hot 主要用来编码类别特征，即采用哑变量(dummy variables) 对类别进行编码。它的作用是避免因将类别用数字作为表示而给函数带来抖动。直接使用数字会给将人工误差而导致的假设引入到类别特征中，比如类别之间的大小关系，以及差异关系等等。

6.在模型评估过程中，过拟合和欠拟合具体指什么现象（如何描述这两个现象）
过拟合是指模型对于训练数据拟合呈过当的情况，反映到评估指标上，就是模型在训练集上的表现好，但是在测试集和新数据上的表现较差。欠拟合指的是模型在训练和预测时表现都不好。用模型在数据上的偏差和方差指标来表示就是。欠拟合时候，偏差和方差都比较大，而过拟合时，偏差较小但方差较大。

7.降低过拟合和欠拟合的方法（从多个维度来考虑，比如数据，特征，模型，目标函数等等）
在这里插入图片描述