关于神经网络线性层计算nn.Linear

model = nn.Linear(in_features,out_features)
x = torch.randn(72,512)
model(x)

期中Linear的weight和bias如何默认参数初始化的:

weight:

在以下范围内均匀分布

(- 1 / sqrt(in_features) , 1 / sqrt(in_features) )

形状:size(out_features,in_features)

bias:

网络上写的是默认全为0,但是实际测试不是,结果如下

形状为[out_features]

model(x) = x @ weight.T + bias

运算要求 :

x的最后一个维度要和,in_features相等才能做矩阵乘法

运算过程:

如果x为大于等于三维,会有一个先降维再升维的过程

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值