为什么使用激活函数？

柯南博客园

已于 2024-09-23 10:25:41 修改

阅读量383

点赞数 10

分类专栏：深度学习文章标签：人工智能

于 2024-08-30 22:45:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_51925699/article/details/141728854

版权

深度学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

分段线性曲线

对于简单的线性模型,即y=b+wx,仅凭一条直线无法解决现实中很多问题的，所以要引入分段线性曲线，例如下图

从图中可以观察到红色线条（分段线性曲线）作为真实情况是无法用类似一条蓝色线条来描述的，同时我们可以看到不同的w影响的是斜率，不同的b影响的是截距

如何表示分段线性曲线呢？

其实红色线条作为真实曲线，利用模型训练很难训练出完全重合的模型参数，仅仅可以无限贴近，那么如何去无限贴近呢？

第一种方法，借助多个hard sigmoid函数进行组合成红色曲线

这里hard sigmoid函数很难描述，所以我们常把他近似为sigmoid函数

第二种方法，借助Relu激活函数，两个Relu激活函数可以合起来一个hard sigmoid函数

其实Relu,和Sigmoid都是常用的激活函数

激活函数的使用

第一种，平行使用多个激活函数，进一步构造较为复杂的函数，来解决复杂问题

第二种，嵌套使用，其实一个激活函数的结果可以作为激活函数的输入

这也是为什么我们平时看见的神经网络是多层的原因，其实归根到底，一个完整的网络激活函数的使用采用的是这两种方式

Sigmoid 或 ReLU 称为神经元（neuron），很多的神经元称为神经网络（neural network）。人脑中就是有很多神经元，很多神经元串起来就是一个神经网络，跟人脑是一样的。人工智能就是在模拟人脑。神经网络不是新的技术，80、90 年代就已经用过了，后来为了要重振神经网络的雄风，所以需要新的名字。每一排称为一层，称为隐藏层（hidden layer），很多的隐藏层就“深”，这套技术称为深度学习。

机器学习框架

柯南博客园

关注

10
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。