Datawhale X 李宏毅苹果书 AI夏令营机器学习简述 task1

最新推荐文章于 2024-10-02 00:23:27 发布

sunset_light

最新推荐文章于 2024-10-02 00:23:27 发布

阅读量346

点赞数 11

文章标签：人工智能机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sunset_light/article/details/141610277

版权

一、什么是机器学习

机器学习（Machine Learning，ML）就是让机器具备找一个函数的能力。

随着要找的函数不同，机器学习有不同的类别：

1.回归：假设要找的函数的输出是一个数值，一个标量（scalar），这种机器学习的任务称为回归。

2.分类：分类任务要让机器做选择题。人类先准备好一些选项，这些选项称为类别（class），现在要找的函数的输出就是从设定好的选项里面选择一个当作输出，该任务称为分类。

3.结构化学习：机器不只是要做选择题或输出一个数字，而是产生一个有结构的物体，比如让机器画一张图，写一篇文章。这种叫机器产生有结构的东西的问题称为结构化学习。

二、机器学习求解函数的过程

1.第一个步骤：

写出一个带有未知参数的函数 f，其能预测所需值。

比如将函数写成

$y=b+wx_{1}$

其中，y 是所需预测值。 $x_{1}$ 参考值，即已有参考数值。y 和 $x_{1}$ 都是数值，b 跟 w 是未知的参数，它是准备要通过数据去找出来的。

w 跟 b 是未知的，只是隐约地猜测。猜测往往来自于对这个问题本质上的了解，即领域知识（domain knowledge）。在猜测中，将参考值乘上一个数值，得到大致数据，最后再加上一个 b 做修正，即为预测值。

带有未知的参数（parameter）的函数称为模型（model）。模型在机器学习里面，就是一个带有未知的参数的函数，特征（feature） $x_{1}$ 是这个函数里面已知的，它是来自于后台的信息，而 w 跟 b 是未知的参数。w 称为权重（weight），b 称为偏置（bias）。

2.第二个步骤：

定义损失（loss），损失是函数 L(b, w)，其输入是模型参数 b 跟 w。损失函数输出的值代表在当前参数 b 和 w 选取的值下，函数 f 预测结果的好坏。

真实的值 y 称为标签（label），计算出的预测值 yˆ 。计算两者的差距 e 来判断好坏。比如取绝对值：e = |y − yˆ|

代入 n 组数据，计算出每组的差距并求平均，得到损失

其中，N 代表训验数据的组数，L 是每一笔训练数据的误差 e 相加以后求平均的结果。L 越大，代表现在这一组参数越不好，L 越小，代表现在这一组参数越好。

我们可以计算不同的 w 和 b 的组合对应的损失，并由此画出图1 所示的等高线图，称为误差表面（error surface）。在这个等高线图上面，越偏红色系，代表计算出来的损失越大，就代表这一组 w 跟 b 越差。如果越偏蓝色系，就代表损失越小，就代表这一组 w 跟 b 越好，拿这一组 w 跟 b，放到函数里面，预测会越精准。

图1 误差表面

3.第三个步骤：

解一个最优化的问题，即找出一组最优的 w 跟 b，使得数值代进去可以让损失 L 的值最小。

以梯度优化方法举例，如图2所示。

图2 梯度优化过程

综上，机器学习的简洁步骤为：创建模型——检验损失——优化最佳。

关注

11
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。