mobaxterm 问题 cuda out of memory
原因:别人跑代码占用了显存。 nvidiasmi命令应该能看到服务器上一共有多少显存,别人用了多少,还剩多少,都能看到的。 top命令,能看到每个进程是谁的
DataLoader是一个循环迭代器
1.dataset 2.创建dataloader 3.将dataloader迭代循环
分辨率就是feature map的尺寸. 深度越深的,得到的特征图像语义高(知道是什么对象)、分辨率低,位置信息不明确。
图像相关
图像通道数:每个点能存放多少个数。Eg.RGB图像每个像素点能存放3个值,即3通道。
位深度:每个像素点占的bit位数。决定色彩图像的每个像素有可能的颜色数或者确定灰度图像的每个像素可能有的灰度级数。 二值图像(非黑即白)像素点是0/1,占1位,即深度1;灰度图像像素点0-255,深度位8; RGB是24位。
分辨率=高x宽
图像size=分辨率x位深=高x宽x位深
深度学习模型的输出是:#维度是batch, num_classes, h, w
U-net++
输出数据的通道数=输出的特征图的数量=我们分类的个数
解释FCN和U-net++ U-Net+与FCN的区别+医学表现+网络详解+创新 - 知乎 (zhihu.com)
U-net中没有全连接层,因此图像尺寸不需要固定,但是 在U-Net中, 池化是2x2(每次宽、高减半)的且是valid策略,即没有padding,因此要保证输入的图像在经过每一次池化的时候都要是边长偶数。
好的方法:从最小分辨率(分辨率就是feature map的尺寸)出发沿收缩路径的反方向进行计算,得到输入图像的尺寸
- 卷积层中的卷积核的通道只能设定为该层输入数据的通道,而大小可自定义(这里是3x3)
- 卷积层中的卷积核的数量==输出特征图(output feature map)的数量(即输出数据的通道数)
U-net大家族:GitHub - ShawnBIT/UNet-family: Paper and implementation of UNet-related model.
3.6
边界关键点选择算法
Dilated-Net+BPB+SBE:解决分割边界模糊问题 (CVPR2020) - 云+社区 - 腾讯云 (tencent.com)
一些先进的论文
9102年了,语义分割的入坑指南和最新进展都是什么样的 - 云+社区 - 腾讯云 (tencent.com)
研究方向
2020年,语义分割方向该怎么走? - 云+社区 - 腾讯云 (tencent.com)
domain adaption 领域自适应
将某个领域训练出来的模型迁移到另一个领域,这两个领域分布差别较大,domain adaption就设计一个特征提取器,想办法从两个领域中提取尽量一致的特征。
域分类器:域分类器的任务就是负责鉴别特征提取器输出的特征是来自源域数据还是目标域数据