神经网络初步

线性模型与非线性模型

人工神经网络是一种计算机算法

考虑以下问题:

假设需要将苹果和梨按照直径和重量进行分类任务

注意此时的数据是线性不可分的

如上图所示,显然这是线性不可分的

那么如何实现其可分呢

如果一条直线不可分,那么可以做多条直线,如下图中的绿线,每一条线对应的逻辑图在右边

z = 1*w0 + 1*w1 + 2*w2

后面的这个

是求一个概率

在最优化以后,就可以得到如图所示的绿线

第二个图和第一个图的区别就是w不同

我们现在把2层拓展到3层,就像这样

最终的结果就是这样的

可见,对于线性不可分的模型,多取几个就可以变成线性可分的模型

以上的线性到非线性的转变,一个重要的因素就是sigmod激活函数,也就是这里的:

若不加这个激活函数,则无论w和b是怎么变化的,其最后一层输出的结果只是各个单个线性模型的相加而已,最终得到的还是一个线性模型,证明如下:

显然最后的结果还是线性模型

而有了非线性的模型,我们就可以解决非线性的问题,为什么加了激活函数之后,我们就得到了非线性的模型呢,证明如下:


前向传播

前向传播就是从左到右

前向传播的示意图如下:

这里的这个:

其实是一个偏置项

这个乘上就相当于一个bias

反向传播

反向传播的目的是去优化W和b

反向传播是从loss出发,loss是指我们通过模型算出来的值和真实值之间的差距

这个差距当然是越小越好

如果没有反向传播,想得到每一个初始的节点对于loss的贡献值是难以计算的

但是若使用反向的方法,将loss一级级地往前推

关于前向传播和反向传播详细的介绍,见后面的文章

参考资料:https://www.bilibili.com/video/av26416178/?spm_id_from=333.788.videocard.3

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值