Datawhale X 李宏毅苹果书 AI夏令营

最新推荐文章于 2024-09-29 22:27:37 发布

m0_72599446

最新推荐文章于 2024-09-29 22:27:37 发布

阅读量329

点赞数 9

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_72599446/article/details/141614133

版权

第一章机器学习基础

一、基本概念

机器学习：我们可以将许多事项抽象为一个函数，机器学习就是让机器具备找到这个函数的能力。

回归：通过寻找和改进函数逐步逼近最佳拟合的数值的过程。

分类：在数据库中训练算法，以预测新的数据类别。

结构化学习：机器不仅要输出一个数值或者做选择题，还需要产生一个结构化的结果。

二、机器学习运作过程

1.假设一个带有未知数的方程，我们将含有未知参数的函数称为模型(model)

如：y=ωx+b

其中， ω称为权重(weight)

b称为偏置(bias)

2.定义损失(loss)

损失可以帮助我们判断当前模型中的数值好还是不好，记为L(b, ω)。损失计算方法比较多可以取模型估测值和真实值差的绝对值，也可以计算二者差的平方，我们将每组数据的损失加起来取平均可得到损失L。

通过调整不同参数与真实数据做对比我们可以得到一个可视化的误差表面。下图为有两个未知变量的二维误差表面。

3.模型优化

一般采用最为常用的梯度下降方法

假设我们的模型只有一个未知数ω，先选取一处数据对损失L进行微分，计算这处数据的斜率；若斜率为负，将ω变大，损失则变小；若斜率为正，将ω变小，损失则变小。

学习率：我们可以通过自行设定数据的间隔，大一点则参数更新就会量大，学习就会快一些。

这种需要自己设定而不是机器自己找出来的参数称为超参数

具体优化方法：

我们反复执行上述操作最终可得到损失最小的ω，但同时这个最小也有可能是局部最小，如下图为拥有一个未知变量的一维误差图，ωT虽然是两则曲线的最低点但他仍然不是整体最小值。

同理，在拥有两个未知参数的模型中。我们对其两个未知参数求偏微分分别进行计算：

所得误差图如下图所示。

关注

9
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。