简易人工智能入门(1)

一、监督or非监督

监督学习(Supervised Learning):训练集有标记信息(Y),学习方式有分类和回归
无监督学习(Unsupervised Learning):训练集没有标记信息,学习方式有聚类和降维
强化学习(Reinforcement Learning):有延迟和稀疏的反馈标签的学习方式

二、分类or回归

分类:结果是几个离散类型,比如猫狗二分类,手写数字10分类
回归:结果是连续值,比如房价预测,最后的结果可以是是float数字

三、如何购买苹果

1、监督学中,分类问题,最后是买 or 不买,二分类
2、这是历史数据,我们把尺寸、重量等称为特征(x);买或者不买为标签(y)

在这里插入图片描述

四、训练 or 预测

在这里插入图片描述1、训练阶段:通过苹果的历史数据,把苹果的特征(x)和标签(y)“计算”为模型

2、预测阶段:把当前苹果的特征(x)输入到模型;得到结果(y_hat 不是y,只是个预测值) 买或者不买

五、线性模型如何训练(理解)

大家可能会好奇,模型里面有什么?模型里面有几个东西,比较重要的就是参数
下面从最简单的监督模式–回归问题中–线性回归模型引入如何训练
下图是波士顿房价历史数据(训练数据,包含特征和标签两部分),通过训练可以得到一个模型

在这里插入图片描述
1、可能特征和标签的关系是 :price = warea · area + wage · age + b 其中 w是权重 ,b是偏置,这两个都是参数
2、更加简洁一些:y = w1x1 +w2x2 + b
训练就是通过x和y确定w和b,预测就是通过w,x和b计算y
下面开始手写训练过程:
1、假设b=0
2、w1*50 + w2*20 + 0 = 100 ;方程(1)
w1*60 + w2*10 + 0 = 200 ;方程(2)
方程(2)*2 - 方程(1)可以得到w1约等于4.3,最后可以得出w2
3、这个通过x和y得出w和b的过程叫训练
4、上面是最简单的线性模型,只是让大家理解,实际过程比这个复杂

六、损失函数(基本感受)

如何衡量一个模型中参数好坏?
在这里插入图片描述
上图中蓝色的点表示5个样本点,4条红线表示4种预测的线性关系,哪个更好呢?
损失函数:计算预测值与实际label的差距,损失最小的就是最好的模型。
在这里插入图片描述

第i个点的损失为预测值y_hat - y的差的平方再除以2
5个点合起来的loss为:n=5 (看不懂公式没有关系只需知道把5个误差进行平均就行
在这里插入图片描述
这样可以得出某个红色的线是4条种最优的,但不是最好的,因为仅仅是在这四个可能性种最好的,可能还存在更好的。

七、损失函数(进阶应用)

在这里插入图片描述

左边图形每一个红线的w和b是固定的,能不能让w和b是变量,得到和y的差距的损失的关系,这样就变为了右图,左边每一条红线在右侧都是一个点。y轴是y_hat和y之间的误差,x轴是w,b。(f(x)=wx+b)。
这样我们求出y轴为0点时,w和b就是当前最好的参数。
找到0点的两种办法,(1)对损失函数求导,导数=0的时候就是最低点(2)梯度下降方法
第一种办法在简单线性模型有效,高阶的时候非常困难。比如下面
在这里插入图片描述

梯度下降就像在山上往下走,一步步找到最优点

八、梯度下降

在这里插入图片描述
先从导数的定义说起,导数是y的变换和x变换的比,也就是瞬时的变化比
在这里插入图片描述
上图是导数的定义,p0点的导数反映该点的变化情况。Δy为正,Δx为正。该点导数为正。

在这里插入图片描述

红色三角表示该点导数为负,蓝色三角表示该点导数为正。
在这里插入图片描述

比如当前在θ0处,θ是w和b的函数,此时损失比较大。需要让损失变小,就像从山上往下走一样。从θ0变为θ1,慢慢往下走。最后会边到θ4附近。这样损失就比较小了。找到了比较好的w和b。
我们再看一下θ0如何变为θ1的
在这里插入图片描述

θ1=θ0-学习率*θ0处的导数
防止下降太快学习率是个0到1之间的小数。
关于为什么是减号,这得得说明一下,下面的图θ1是大于θ0的,θ0要变为θ1就得加一个正数。θ处的导数为负(就像红色三角一样),所以是减去导数,减去一个负数,就变为正数了。这样可能变化太快,所以再乘以一个学习率。

  • 12
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值