机器学习内容较难,且概念涉及多,复习难度大,这里回忆记录一下2023年机器学习的考试内容
2023
2023的考试范围是前十章
一、名词解释
基本的概念,难度不大
二、计算题
- 计算查准率P、查全率R
- 计算基于多项式核函数映射的三阶核矩阵
三、简答题
-
类似下题
- 数据集包含100个样本,其中正反例各一半,假定学习算法所产生的模型是将新样本预测为训练样本数较多的类别(训练样本数相同时进行随机猜测),试给出用10折交叉验证法和留一法分别对错误率进行评估所得的结果。
10折交叉验证:交叉验证中每个子集数据分布要尽可能保持一致,那么本题中10次训练中每次正反例各占45,模型训练结果随机猜测,错误率期望为50%。
留一法:若留出样本为正例,训练集中则有50个反例和49个正例,模型预测为反例;反之留出样本为反例,模型预测为正例,错误率为100%。
-
阐述预剪枝和后剪枝的优缺点
-
朴素贝叶斯的前提假设
-
去中心化下题
四、证明题
- 免费的午餐
- 证明两个异类支撑向量到超平面的距离之和是 2 ∣ ∣ w ∣ ∣ \frac{2}{||w||} ∣∣w∣∣2
五、算法题
- 阐述线性判别分析
- 阐述k-means
整体感受
名词解释题基本上都可以复习到,计算题的出题范围比较有限,比如决策树中的指标计算、误差反向传播、核函数核矩阵的计算、基本指标的计算,简答题和证明题出自研讨PPT后的题较多,可以多关注,算法题基本上就是所有算法的范围了