机器学习基本概念

最新推荐文章于 2024-03-15 11:24:36 发布

贩卖阳光的杨同学

最新推荐文章于 2024-03-15 11:24:36 发布

阅读量231

点赞数

分类专栏：机器学习文章标签： java 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42394917/article/details/126910550

版权

机器学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

一、机器学习分为三步：

Step1、Function with unknown（带有未知数参数的函数）

根据所存在的数据集（训练集）提出一个模型 F （ y = b + wx）:

x: 输入值（数据来自训练集）即为 feature

w: 权重 -- weight

b：偏移 -- bias

y ：根据x得出预测值即输出值

Step2、Define loss

Loss 就是函数即为 L(b , w)

含义：表示此b,w 所确定的model，其得出的预测值y与真实值 $\hat{y}$ 之间差距

eg：如下图：

其中 $L = \frac{1}{N}\sum_{n}^{}e_{n}$

关于e 计算方式有三种，即损失函数有三种情况：

利用相同的训练集，训练不同的w与b，得到一个图形，该图形横坐标为W，纵坐标为b，其线表示对应w与b的Loss

那么如何找到min的L呢？

就需要第三步，参数优化

Step3、optimation

通过一种方式，优化L，使L最小化，从而得到最优的参数w，b

如何优化L呢？

其中一种方式为 梯度递减 Gradient Descent

为了方便起见，以一个参数来表示梯度递减运行思路，如下图：

1、首先、随机初始化参数 $W^{\circ}$

2、其次、计算此处 $W^{\circ}$ 的微分，即该点 $W^{\circ}$ 的斜率，判断此处微分(斜率)是>o or <o

若>o, W这个参数向左移动（减小W值）；否则增大

3、最后、直到W移动到error surface 的最低点即停止，因为此时该点的微分为0

Ps：1、关于W参数移动的步长有两因素组成：对应点的微分值； $\eta$ （learning rate）

2、关于使用梯度递减，只会到达error surface的local minma 而非global minima 是伪命题

实际对于两个参数求其中Loss最小值，如下图：

（根据梯度递减，不断优化L，只有得到参数w，b的最优解）

Ok，此时我们假装自己不知道未来的数据，其实我们是根据过往的数据，即训练集来训练出最终的model （y = 0.1k + 0.97x）。而这个model的L = 0.48k （即误差为0.48k）

但我们真的会在意这个次数吗？

不是的，我们真正关心的是对于未来的数据，是否能预测出正确的数值。

所以，接下来，我们用这model （y = 0.1k + 0.97x）用test数据集预测未来的数值

其误差值L' = 0.58k

那么能不能做的更好呢？

在此之前，我们先用model （y = 0.1k + 0.97x）与 test数据集画图，找关系

你会发现，他们是有周期性的，每隔7天一个循环

那我们知道这个model是个烂的，因为此model是每隔1天

而我们应该升级model，使model每隔7天

所以，这个过程就是对model（模型）进行修改，而对于模型的修改往往来自于我们对问题的理解，就是Domain Knowledge。

而一开始，当不理解问题时，我们是随便写的一个model，之后根据结果误差，发现可以更新。如下图：

这样的model，有个共同的名字：Linear models

二、基本概念

回归 -- 函数输出值为数值（scalar）

分类 -- 给定多个classes，函数输出正确的class

贩卖阳光的杨同学

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习基本概念

机器学习基本概念
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。