pytorch编程
yy2yy99
这个作者很懒,什么都没留下…
展开
-
完美解决问题:Failed to get convolution algorithm
转自:https://zhuanlan.zhihu.com/p/171703337找了很多解决方案,一一试过,都没有成功,就在山重水复之时,看到了这篇博客,终于把问题解决了,所以转载一下,以备不时之需。多谢作者!!!写在前面用pycharm或jupyter notebook运行卷积神经网络时会出现问题:Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try l转载 2020-09-24 15:47:01 · 807 阅读 · 0 评论 -
imdb_wiki数据集的解析
代码及解析:import osimport cv2import reimport timeimport randomimport shutilimport globimport scipy.ioimport numpy as npfrom shutil import copyfilefrom datetime import datetime, timedeltafrom multiprocessing import Poolfrom config import confi转载 2020-07-10 09:53:41 · 990 阅读 · 0 评论 -
Pytorch固定部分参数(只训练部分层)
参考:https://www.cnblogs.com/jiangkejie/p/11199847.html在迁移学习中我们经常会用到预训练模型,并在预训练模型的基础上添加额外层。训练时先将预训练层参数固定,只训练额外添加的部分。完了之后再全部训练微调。在pytorch 固定部分参数训练时需要在优化器中施加过滤。class RESNET_attention(nn.Module): def __init__(self, model, pretrained): super(R转载 2020-07-09 18:09:00 · 3169 阅读 · 1 评论 -
SSD目标检测:conv4_3特征的L2Norm处理
正则化方式的选择: 原生态SSD中,特征金字塔不同特征层上的特征值,有不同的尺度范围(different ranges of value),SSD采取的做法为:使用L2-Normal正则化conv4_3;FSSD使用方案更简单有效:将concate后的特征,后接一个BN层,从row2、6对比可知,新增BN层可以带来0.5%的性能提升。(1)L2 Normalization公式及作用:对于一行向量,其L2归一化公式入下所示,其中D为向量长度:在深度神经网络中,偶尔会出现多...原创 2020-05-13 14:04:52 · 1480 阅读 · 2 评论 -
pytorch报错:ValueError: Expected more than 1 value per channel when training, got input size [1,8,1,1]
问题:在用pytorch训练模型的过程中如果出现如下错误:Expected more than 1 value per channel when training, got input size torch.Size([1, 8, 1, 1])修改方式:从dataset中删掉最后一个sample。问题分析:模型中用了batchnomolization,训练中用batch训练的时候,最后一...原创 2020-03-31 09:11:26 · 1008 阅读 · 0 评论