Output Shape和Param参数解释

方如一

已于 2022-03-10 20:45:18 修改

阅读量5.4k

点赞数 4

分类专栏： Python内置函数文章标签：深度学习机器学习算法

于 2022-03-04 21:31:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Fwuyi/article/details/123285747

版权

Python内置函数专栏收录该内容

23 篇文章 11 订阅

订阅专栏

查看模型时，可以得到下列图形：

由于输入层和隐藏层是一块建立的，因此查看模型时输入层和隐藏层只有一层dense（Dense），在该层中输出了两个参数，分别是 Output Shape =（None，256），Param=200960。

Output Shape 第一个参数是Batch size（批尺寸），当批尺寸为None时，表示把数据一次性都放进模型中训练；第二个是输入的shape，输入了256个一维数据。

Param是200960，第一层输入数据（1，784），根据输出的计算公式 $Output = activation ( input \cdot kernel + bias)$ ，可知 $input\cdot kernel$ 结果是（784，256）， bias 数据是（1，256）。Param = 784 x 256 + 256 = 200960。

总的来说，每一层的Param可以这么计算：

Param = (上一层神经元数量）x （本层的神经元数量） + （本层的神经元数量）

其中，(上一层神经元数量）x （本层的神经元数量）：代表的是 $input\cdot kernel$ 的参数

本层的神经元数量：代表的是 bias 的参数

照着这种思路，检验一下dense_1(Dense)的参数是否是这样的。在该层中输出了两个参数，Output Shape =（None，10），Param=2570。

输出是（1，10）的数据，因此Output Shape的第二个参数为10，没问题。

Param=256*10+10=2570，因此Param为2570，没问题。

关注

4
点赞
踩
41

收藏

觉得还不错? 一键收藏
1
评论
Output Shape和Param参数解释

查看模型时，可以得到下列图形：由于输入层和隐藏层是一块建立的，因此查看模型时输入层和隐藏层只有一层dense（Dense），在该层中输出了两个参数，分别是 Output Shape =（None，256），Param=200960。Output Shape 第一个参数是Batch size（批尺寸），当批尺寸为None时，表示把数据一次性都放进模型中训练；第二个是输入的shape，输入了256个一维数据。Param是200960，第一层输入数据（1，784），根据输出的计算公式，可知结果是.
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。