注:本提纲针对课本内容,PPT需要全看。
考试题型:
选择10道 填空10道 判断10道 简答4/5道 计算4/5道
计算:线性回归/逻辑回归/决策树/梯度下降策略/BP神经网络计算输出值
选择:都是原题。PPT中98道选择+Edu选择
第一章
1.机器学习的定义。
2.什么是版本空间。
3.“没有免费的午餐“定理
4.人工智能,机器学习,深度学习三者间的关系。
5.机器学习方法的分类:一类是有监督学习,一类是无监督学习。
第二章
1.什么是过拟合和欠拟合?过拟合是由什么导致的?如何缓解过拟合?
2.常见的评估方法:留出法,交叉验证法,自助法。
3.什么是调参
4.性能度量:查准率,查全率,F1分数的计算(2章PDF第84页例题)
5.ROC与P-R的区别
6.偏差与方差的计算
第三章
1.对离散属性,有序关系,通过连续化转化为连续值;对无序关系,进行哑变量化。
2.哑变量化的优点好处有哪些?
3.Sigmoid函数
4.线性判别分析的基本原理是?
5.多分类学习中,经典的拆分策略。三个过程都要掌握。
6.类别划分通过编码矩阵制定,编码矩阵常见的形式。
7.“再缩放”的三类做法:欠采样,过采样,阈值移动的定义、过程。
8.损失函数
第四章
1.K近邻算法优缺点,k值的选取对结果的影响,kd树
2.根据训练集生成CART决策树。
3.剪枝处理的基本策略
第五章
1.BP神经网络计算输出值
2.bp神经网络过程
第六章
1.样本空间中任一点到超平面的距离计算
2.正则化
3.软间隔支持向量机和硬间隔支持向量机的区别