pytorch系列 ---9的番外， Xavier和kaiming是如何fan_in和fan_out的，_calculate_fan_in_and_fan_out解读 Conv2d

最新推荐文章于 2025-05-24 18:01:17 发布

墨氲

最新推荐文章于 2025-05-24 18:01:17 发布

阅读量5.5k

点赞数 5

CC 4.0 BY-SA版权

分类专栏： pytorch 记录 python3 pytorch0.4系列教程文章标签： pytorch weight_initialization

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dss_dssssd/article/details/83992701

本文详细介绍了如何在PyTorch中计算线性层（Linear）和卷积层（Conv2d）的fan_in和fan_out。通过代码示例，解释了当权重张量维度为2时，对应线性层的fan_in等于输入通道数，fan_out等于输出通道数；而在卷积层中，fan_in和fan_out涉及卷积核大小，并通过计算权重张量特定维度的元素数量来确定。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文主要借助代码讲解Xavier和kaiming是如何借助_calculate_fan_in_and_fan_out函数来计算当前网络层的fan_in（输入神经元个数）和fan_out（输出神经元个数的），先针对Linear和Conv2d两种。

在这里插入图片描述

m_c = nn.Conv2d(16, 33, 3, stride=2)
m_l = nn.Linear(1, 10)
m_c.weight.size()
m_l.weight.size()

out:

torch.Size([33, 16, 3, 3])
torch.Size([10, 1])

注意看Linear weight的维度为2，而Conv2d的维度为4.
首先判断tensor的维度，如果是二维，则是Linear，

if dimensions == 2:  # Linear
        fan_in = tensor.size(1)
        fan_out = tensor.size(0)

此时： $fan\_in = in\_channels$
$fan\_out = out\_channels$

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。