机器学习考试总结

最新推荐文章于 2024-06-12 19:05:13 发布

吕祖茂

最新推荐文章于 2024-06-12 19:05:13 发布

阅读量1.7k

点赞数 10

分类专栏：机器学习文章标签：机器学习人工智能决策树

本文链接：https://blog.csdn.net/weixin_43744296/article/details/112510468

版权

本文总结了机器学习考试中的核心概念，包括过拟合、欠拟合的定义及其对策，错误率、精度、查准率、查全率等评估指标，以及训练集、测试集的划分方法。还涉及P-R曲线、ROC曲线、AUC曲线，线性回归、决策树的选择策略，以及神经网络和SVM防止过拟合的手段。此外，文章涵盖了朴素贝叶斯分类器、集成学习、降维方法、监督学习和无监督学习的区别，以及L1和L2范数正则化的应用。

摘要由CSDN通过智能技术生成

概念掌握

1.过拟合、欠拟合

过拟合：本来应该学习训练样本中的普遍规律，以便在遇到新样本的时候能够做出正确的判别。但是因为学习器学的太好了，把训练样本中自身的一些特点当作了样本会具有的一般性质，导致了泛化能力的下降。通常由于学习器的学习能力过于强大，所以各类算法一般都带有针对过拟合的措施。过拟合无法避免！
欠拟合：通常由于学习能力低下造成，没有学到样本的普遍规律。神经网络可以通过增加训练轮次、决策树可以扩展分支来进行克服。

2.错误率、精度、查准率、查全率，测试集、验证集、训练集，留出法、交叉验证法

错误率：分类错误的样本占样本总数的比例。如在m个样本中有a个样本分类错误，则错误率E：
$\frac{a}{m}$
对于样例集D，分类错误率定义如下：其中Ⅱ(·)为指示函数，在 ‘·’ 为真和假时分别取值1，0
$\frac{1}{m} \sum_{i=1}^{m}Ⅱ(f(x_{i} ≠y_{i} ))$
对于数据分布D和概率密度函数p(·)，错误率定义如下：
$\int_{x\sim D}^{}Ⅱ(f(x)≠y)p(x)dx$

最低0.47元/天解锁文章

吕祖茂

关注

10
点赞
踩
33

收藏

觉得还不错? 一键收藏
1
评论
机器学习考试总结

文章目录概念掌握1.过拟合、欠拟合2.错误率、精度、查准率、查全率，测试集、验证集、训练集，留出法、交叉验证法3.P-R曲线、ROC曲线、AUC曲线4.线性回归概念(3.2看懂)5.决策时如何选择分裂点(信息增益、增益率、基尼指数)6.对于神经网络、SVM怎么调节才能避免其过拟合或者欠拟合7.朴素贝叶斯分类器(先验、后验、使用的条件)8.集成学习的概念9.降维的概念及最基本的方法10.监督学习和无监督学习11.L1范数和L2范数推导计算1.最小二乘“参数估计”（3.5-3.8）2.给出感知机的公式和几个具体
复制链接

扫一扫

专栏目录