目录
一、前言
上周主要完成:
- ①对比实验执行:InversionNet、DD-Net70
- ②消融实验执行:TU-Net的部分消融实验(包括损失函数调整与网络架构调整-移除TWM模块,观察实验结果);
- ③论文表达能力提升(学习如何将描述即插即用模块对相关任务的重要性描述清楚,如何构建更强的逻辑性);
本周主要完成:
- ①论文损失函数与介绍部分的讨论;
- ②基于盐数据设计TU-Net的网络架构;
- ③验证TU-Net在SEG模拟盐数据上的适用情况;
二、完成情况
2.1 遇到的问题及解决
2.1.1 盐数据网络情况与损失函数不下降
首先基于盐数据设计了两个相应的网络架构,但是在运行训练的过程中,出现了损失函数不下降的情况,起初我以为损失函数的值会随着一段时间的训练下降,但是并非如此,情况如下图所示:
损失函数始终不下降,因为我就停止了训练,开始查找问题。一开始我认为是网络架构的问题,于是我换了另一个网络结构来验证这一想法。但是依旧出现了上述情况,因此应该不是网络架构的问题,是网络里面的部分设计存在问题。
我对比了FCNVMB与DD-Net的网络架构,发现他们在网络的末端有一处与我的不同:
通过对比网络结构,我发现FCNVMB与DD-Net的最后没有使用激活函数,这是因为我们的数据没有进行归一化,所以不需要这个操作。于是,我对这里进行了修改,然后损失函数开始正常下降。
在完成网络架构设计及问题解决后,初步进行实验验证TU-Net在SEG模拟盐数据上的指标情况。部分测试情况如下:
从上图可以看出,部分测试情况还不错,能基本正确反演出盐体的形状与层状边缘情况,但是有些时候效果很差。另外,在训练过程中,验证集的波动很大,如下图所示:
可能有如下原因:
- batchsize设置太小,模型学习的规律不过“普适”;
- 学习率太大,模型陷入局部最优点;
- 网络结构设计有问题等
因此,之后会从上面可能的原因入手进行调整;
2.1.2 其他问题
在训练过程中,遇到下述问题,猜测可能是有其他软件占用内存:
2.2 损失函数与介绍部分讨论
- 写论文需要站在始终读者的角度理解研究背景、动机、方法等;
- 始终需要建立在树型结构的基础上;
- And不能放在句首;
- 在介绍网络架构之前,应该先介绍输入与输出,使读者有一个简单的认知;
- 在模块介绍时,如果architecture太大的话,可以使用structure;
- 论文中应该只有design,毕业设计里面才能出现实现;
三、下周计划
- 根据论文讨论情况,修改损失函数与介绍部分;
- 继续完成实验,先测试SEG的网络架构,将一些消融实验留在下周;
- 修改盐数据数据模型的输出;