- 博客(2)
- 收藏
- 关注
原创 第二天实验踩坑记录
batchnorm层主要作用对每个批次的输入都归一化至均值为0,方差为1的标准正态分布,保持输入的分布一致性,可以加速网络的收敛。回归预测与分类问题不同,分类问题需要在最后一层加激活函数映射至类别概率(0-1之间),而回归预测则不需要。出现这个原因主要就是因为view()需要Tensor中的元素地址是连续的,因为可能出现Tensor不连续的情况,修改为:在.view前加.contiguous(),使其变为连续就ok。x = x[:, -1, :] 可以去掉第二维,例如【8,12,14】变为【8,14】
2023-08-09 14:06:59
37
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人