西瓜书第一~二章学习笔记

一、收获

什么是机器学习,可以理解为数据通过学习算法计算得到学习模型。因而影响机器学习的三要素是数据、算法、算力。

关于数据,它被分为训练集,验证集,测试集,都应该与样本数据保持独立同分布,这样才能避免额外偏差的产生。我们用训练集训练模型,在测试集上判别模型泛华效果,基于验证集上的性能来进行模型选择和调参。由于过拟合与泛化能力不可调和的矛盾,产生了很多种优劣势不同的划分数据集的方法,常见的有k折交叉验证法,留一法,自助法。

关于学习模型,他是机器对数据潜在规律的一种解读,被称为假设,相对于数据客观存在的规律,假设有很多种,为了衡量假设的泛华能力,引入性能度量指标。常见的由均方误差、错误率、查准率与F1。

二、疑问

为什么过拟合与拟合之间是NP!=P的问题?

随机变量的期望计算公式

F1指标贝塔系数的理解,查准率与查全率的联系

什么是假设空间,机器学习基础概念的数学定义是什么

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

且听风吟iii

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值