![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
前进ing_嘟嘟
记录那些年我们淌过的坑,愿能撑人一把,也有人撑自己一把
展开
-
卷积神经网络轻量化的处理思路
参考:为什么轻量化网络就是快? - 知乎这个帖子很全很有意思标准卷积在空间域和通道域进行卷积,这两部分是相乘的,为了轻量化,有两个方向的处理思路来减少当空间域卷积复杂时对应的通道域的复杂度:减少通道数:通过1*1conv,降低通道数,再进行相应的空间域卷积和低通道数的通道域卷积,如果需要恢复通道数,则再通过1*1conv恢复通道数(ResNet的带瓶颈层残差单元的处理方案) 通过分组卷积降低通道域的复杂度:减少通道域的链接。一种特殊情况是对每个通道单独进行卷积,为逐深度卷积。为了不降低精度,在分组原创 2022-05-13 17:16:07 · 1367 阅读 · 0 评论 -
docker中运行程序,pdf.set_trace()后打字卡顿
docker中运行deep learning程序,pdf.set_trace()后打字卡顿,无法输入想输入的命令原因:docker的共享内存满了方法:减小work num,batch size等,减小内存占用原创 2022-04-02 16:07:07 · 822 阅读 · 0 评论 -
optimizer.zero_grad()和net.zero_grad()
如果 optimizer=optim.Optimizer(net.parameters()),optimizer.zero_grad()和net.zero_grad()是等价的原创 2022-03-07 16:01:06 · 374 阅读 · 0 评论 -
经过test之后再trainRuntimeError: element 0 of tensors does not require grad and does not have a grad_fn
我的程序训练一段时间,进行test输出,继续训练的时候出现标题所述问题。我遇到的问题不能通过loss.requires_grad_(True)解决。后发现原因是,我传入test的网络模型是用于train的网络模型实例。该问题的解决方案是不要将用于train的实例传入test,即假设net = Model.net1(),则不要test不要传入net,而要传入Model.net1()...原创 2022-03-07 15:35:06 · 355 阅读 · 1 评论 -
从txt或者log文件中提取特定字符所在行,可用于loss曲线绘制
import matplotlib.pyplot as pltimport numpy as npline = []with open(r"./loss.log", encoding='utf-8') as f: # 从log文件中读出数据 for line1 in f: line.append(line1) datalist = []for item in line: strl = item.split() datalist.append(str.原创 2020-08-26 11:51:00 · 658 阅读 · 0 评论