简易人工智能入门（1）

BigBrother@@U

已于 2024-06-24 12:02:25 修改

阅读量947

点赞数 12

分类专栏：人工智能文章标签：人工智能

于 2024-06-21 22:04:25 首次发布

本文链接：https://blog.csdn.net/jjjjjjabnannnan/article/details/139855660

版权

人工智能专栏收录该内容

3 篇文章 0 订阅

订阅专栏

一、监督or非监督

监督学习（Supervised Learning）：训练集有标记信息（Y），学习方式有分类和回归
无监督学习（Unsupervised Learning）：训练集没有标记信息，学习方式有聚类和降维
强化学习（Reinforcement Learning）：有延迟和稀疏的反馈标签的学习方式

二、分类or回归

分类：结果是几个离散类型，比如猫狗二分类，手写数字10分类
回归：结果是连续值，比如房价预测，最后的结果可以是是float数字

三、如何购买苹果

1、监督学中，分类问题，最后是买 or 不买，二分类
2、这是历史数据，我们把尺寸、重量等称为特征（x）；买或者不买为标签（y）

在这里插入图片描述

四、训练 or 预测

在这里插入图片描述 1、训练阶段：通过苹果的历史数据，把苹果的特征（x）和标签（y）“计算”为模型

2、预测阶段：把当前苹果的特征（x）输入到模型；得到结果(y_hat 不是y，只是个预测值）买或者不买

五、线性模型如何训练（理解）

大家可能会好奇，模型里面有什么？模型里面有几个东西，比较重要的就是参数
下面从最简单的监督模式–回归问题中–线性回归模型引入如何训练
下图是波士顿房价历史数据（训练数据，包含特征和标签两部分），通过训练可以得到一个模型

在这里插入图片描述
1、可能特征和标签的关系是：price = warea · area + wage · age + b 其中 w是权重，b是偏置，这两个都是参数
2、更加简洁一些：y = w1x1 +w2x2 + b
训练就是通过x和y确定w和b，预测就是通过w，x和b计算y
下面开始手写训练过程：
1、假设b=0
2、w1*50 +　ｗ2*20 + 0 = 100 ；方程(1)
w1*60 + w2*10 + 0 = 200 ；方程（2）
方程（2）*2 - 方程（1）可以得到w1约等于4.3，最后可以得出w2
3、这个通过x和y得出w和b的过程叫训练
4、上面是最简单的线性模型，只是让大家理解，实际过程比这个复杂

六、损失函数（基本感受）

如何衡量一个模型中参数好坏？
在这里插入图片描述
上图中蓝色的点表示5个样本点，4条红线表示4种预测的线性关系，哪个更好呢？
损失函数：计算预测值与实际label的差距，损失最小的就是最好的模型。

第i个点的损失为预测值y_hat - y的差的平方再除以2
5个点合起来的loss为：n=5 （看不懂公式没有关系只需知道把5个误差进行平均就行）
在这里插入图片描述
这样可以得出某个红色的线是4条种最优的，但不是最好的，因为仅仅是在这四个可能性种最好的，可能还存在更好的。

七、损失函数（进阶应用）

在这里插入图片描述

左边图形每一个红线的w和b是固定的，能不能让w和b是变量，得到和y的差距的损失的关系，这样就变为了右图，左边每一条红线在右侧都是一个点。y轴是y_hat和y之间的误差，x轴是w，b。（f（x）=wx+b）。
这样我们求出y轴为0点时，w和b就是当前最好的参数。
找到0点的两种办法，（1）对损失函数求导，导数=0的时候就是最低点（2）梯度下降方法
第一种办法在简单线性模型有效，高阶的时候非常困难。比如下面
在这里插入图片描述

梯度下降就像在山上往下走，一步步找到最优点

八、梯度下降

在这里插入图片描述
先从导数的定义说起，导数是y的变换和x变换的比，也就是瞬时的变化比

上图是导数的定义，p0点的导数反映该点的变化情况。Δy为正，Δx为正。该点导数为正。

在这里插入图片描述

红色三角表示该点导数为负，蓝色三角表示该点导数为正。
在这里插入图片描述

比如当前在θ0处，θ是w和b的函数，此时损失比较大。需要让损失变小，就像从山上往下走一样。从θ0变为θ1，慢慢往下走。最后会边到θ4附近。这样损失就比较小了。找到了比较好的w和b。
我们再看一下θ0如何变为θ1的
在这里插入图片描述

θ1＝θ0-学习率*θ0处的导数
防止下降太快学习率是个0到1之间的小数。
关于为什么是减号，这得得说明一下，下面的图θ1是大于θ0的，θ0要变为θ1就得加一个正数。θ处的导数为负（就像红色三角一样），所以是减去导数，减去一个负数，就变为正数了。这样可能变化太快，所以再乘以一个学习率。

BigBrother@@U

关注

12
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
简易人工智能入门（1）

关于为什么是减号，这得得说明一下，下面的图θ1是大于θ0的，θ0要变为θ1就得加一个正数。θ处的导数为负（就像红色三角一样），所以是减去导数，减去一个负数，就变为正数了。左边图形每一个红线的w和b是固定的，能不能让w和b是变量，得到和y的差距的损失的关系，这样就变为了右图，左边每一条红线在右侧都是一个点。这样可以得出某个红色的线是4条种最优的，但不是最好的，因为仅仅是在这四个可能性种最好的，可能还存在更好的。先从导数的定义说起，导数是y的变换和x变换的比，也就是瞬时的变化比。
复制链接

扫一扫