Tensorflow2.0中的不同行但同列的矩阵加法

最新推荐文章于 2023-07-27 09:31:45 发布

AndSonder

最新推荐文章于 2023-07-27 09:31:45 发布

阅读量618

点赞数

分类专栏：小白的ai学习之路 TF2 文章标签： tensorflow 深度学习神经网络线性代数

本文链接：https://blog.csdn.net/python_LC_nohtyp/article/details/104078745

版权

83 篇文章 8 订阅

订阅专栏

37 篇文章 2 订阅

订阅专栏

Tensorflow中不同行但同列的矩阵加法

在设置神经网络的时候，我们可能会看到这样的代码

# z=wx,模拟获得激活函数的输入z
z = tf.random.normal([4,2])
b = tf.constant([1.,2.]) # 模拟偏置向量
z = z + b # 累加偏置

其中的z = z + b可能会让你感到非常的诧异什么一个4行2列的矩阵可以和一个1行2列的矩阵相加？？？其实这里的运算法则就是把b看作一个这样的矩阵:

$\begin{matrix} 1 & 2 \\ 1 & 2 \\ 1 & 2 \\ 1 & 2 \end{matrix}$

然后再加起来，问题就是这样

为什么要这样设计呢？
回到我们设计偏置的初衷，我们给每个层的每个输出节点添加一个偏置，这个偏置数
据是对所有的样本都是共享的，换言之，每个样本都应该累加上同样的偏置向量𝒃，如图所示：
在这里插入图片描述

这样的设计方法其实是满足Broadcasting机制，这个在我的另一篇博客中有详细讲述。
链接：https://blog.csdn.net/python_LC_nohtyp/article/details/104097417

关注

专栏目录