机器学习笔记-西瓜书第一章,第二章

本文介绍了机器学习的两大类:监督学习和无监督学习,并以高考为例解释了模型泛化能力的重要性。泛化能力是模型在未知数据上的预测性能,可通过增加数据量、正则化和凸优化来提升。文中以《周志华机器学习》和datawhale教程为参考,探讨了学习过程中的关键概念。
摘要由CSDN通过智能技术生成
1.机器学习大致分类:

根据训练数据是否拥有标记信息,学习任务可大致划分为两大类:
监督学习( supervised learning):代表:分类(classification),回归(regression).其中分类预测的是离散值,例如二分类问题;而回归则预测的是连续值。
无监督学习( unsupervised learning):代表:聚类(clustering)

2.泛化能力

泛化能力 (generalization) 通俗来讲就是指学习到的模型对未知数据的预测能力。在实际情况中,我们通常通过测试误差来评价学习方法的泛化能力。具有强泛化能力的模型能很好地适用于整个样本空间.训练集通常要能很好地反映出样本空间的特性,否则就很难期望在训练集上学得的模型能在整个样本空间上都工作得很好。

举一个通俗易懂的例子,小明(模型)高三了,平时训练要做许多模拟题(训练),最后参加高考(测试),要想高考成绩好,模拟题就要找得好才行。如果平时模拟小明都表现得非常好,但是高考考得一塌糊涂,那他泛化能力就很弱。泛化能力强调的是在新的数据上的表现。

提高泛化能力的方式大致有三种:1.增加数据量。2.正则化。3.凸优化。
第二章的笔记就是在 goodnote做的,所以是图片的形式分享出来。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

此篇文章为本人看书后的一些记录,纯原创,如若有不严谨或错误的地方,还望大家指出,谢谢。
参考:周志华 机器学习,datawhale吃瓜教程

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值