我的深度学习的一些小细节

1.nn.Linear() 既可以作用于1维tensor,也可以作用于多维tensor

当x.shape为(2,3) nn.Linear(3,6) 时,输出x为(2,6)

当x.shape为(2,5,6) nn.Linear(6,4)时,输出x为(2,5,4)

说明:nn.Linear()只作用于最后一维特征,计算公式为x=x*A的转置+b

2.nn.LayerNorm()只作用于最后一维数据

当x.shape为(2,3)时,nn.LayerNorm只对每一行的3个元素进行归一化

当x.shape为(2,5,6)时,nn.LayerNorm会进行10次对一行6个元素的归一化

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值