深度学习---之bias

最新推荐文章于 2024-04-04 23:36:20 发布

zxyhhjs2017

最新推荐文章于 2024-04-04 23:36:20 发布

阅读量3.4k

点赞数 1

分类专栏：深度学习笔记

深度学习笔记专栏收录该内容

56 篇文章 10 订阅

订阅专栏

reference：https://www.zhihu.com/question/68247574

实际上，bias相当于多了一个参数。在增加网络少量拟合能力的情况下，bias和其它普通权值相比无论前向还是后向，计算上都要简单，因为只需要一次加法。同时，bias与其它权值的区别在于，其对于输出的影响与输入无关，能够使网络的输出进行整体地调整，算是另一维自由度吧。放在二维上，权值相当于直线的斜率，而bias相当于截距，这二者都是直线参数的一部分，并没有必要区别对待。

因此，通常网络都会使用bias，但并不是必须，对于网络性能的影响并不是很显著（除非网络太小导致拟合能力太差）。同时，在有些场合里，bias的使用也没有意义，比如在batch normalization层之前的层就没必要加，因为会被归一化抵消掉。

简单考虑一个只有一输入一输出的简单网络：

假设用Sigmoid 激活函数，如果没有bias，则 $Y_{out}= \sigma(X_{in}\cdot W)$

先看一下在不同W下的情况：

假如输入 $X_{in}$ 的输入分布如图中蓝点（A集合）和红点（B集合）所示（在x轴上的分布），要通过 $Y_{out}(>0.5, or <0.5)$ 来判断输入时在A内还是B内，很显然，要提高准确性，sigmoid函数中的W系数需要学的很大，才能保证尽可能的判断准确。

但是如果一个测试样本在图中绿点所在的位置呢，很明显我们可以将绿点判为红点所在的B集合，但是通过训练学到的W是不能正确判断的。这个时候似乎让sigmoid函数变得更陡没法解决了。

但是如果加一个bias呢。

像这样，w（sigmoid中x的系数）不用学的很大就可以提高学习的准确率，网络就能够非常灵活的fit A,B 的分布，可以准确的判断绿点所属的集合。

简单点说，就是加上bias能更灵活的fit输入的分布。

转载：https://blog.csdn.net/zxrttcsdn/article/details/79845706

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。