想当初小小白的时候问的一些奇奇怪怪的问题,记录一下
-
半年前的我:一般训练的时候 epoch都设多少啊?
导师:可以计算。要能把数据集遍历至少一遍,必要的时候多遍历几遍数据集。
要知道你每个epoch用多少数据。
反正要是收敛的比较快,epoch设小一点;收敛的慢 就设大一点。
师姐:就一般loss要比刚开始的低两个小数位差不多,然后不怎么变化了 就基本收敛了
现在的我:请打开tensorboard。 -
半年前的我 :Imagesize是根据数据集中的图片分辨率来设定的吗?
师姐:是的
现在的我:这是什么问题?? -
半年前的我:焊缝的那个图片是6000x2000的分辨率,怎么处理啊?
现在的我:小batchsize,多epoch;或者切割图像再检测。 -
半年前的我:训练的前一般着重调整哪些超参数啊?
师姐:学习率就一般要根据loss的收敛程度来调
其实最好是训练几十个epoch就降低一下学习率这样 (边训练边降低学习率),初始学习率和变化策略
Batch_size根据卡来调整
超参的设置也很重要 阅读论文的时候有时会更加偏向于学习里面的模型结构 忽略它写的超参配置 有时候我们训不出好的效果 不一定是模型结构出了问题 超参配置稍微不一样 就会有很大的不同
然后就是要学会善用tensorboard看指标的变化 -
半年前的我:ssh传大文件大概40分钟才传过去?
师姐:你现在配的是ipv4的地址 用ipv6会更快些 但是ipv6有时候能连接成功 有时候不行
一般除了参数文件和训练数据 没有其他太大的文件了啊
以后要是实在太大 你可以发给我 然后我下载了以后 用u盘传一下吧
现在的我:请在同一局域网网段下传,快到起飞。 -
半年前的我:训练的时候要不要写shell脚本?还有就是常用数据集要不要处理好了全部都放在一个文件夹里(感觉会很整齐)
师姐:是的。可以不写啊 直接运行.py就可以啊。对的 我就是有一个文件夹单独放数据集
现在的我:写个shell吧,不然做实验麻烦得要死,猪头脑子记性又不好。 -
半年前的我:目标检测的指标吗
师姐:显著性对象检测 指标就有pr曲线 然后f值 mae值啥的。测这些指标 在github上是能找到代码的 有matlab版也有python版的。你可以看看相关论文 它们都测了哪些 然后在github上找。不是 就是和准确率差不多 用这些去衡量你的结果好不好。目标检测的话应该是 IoU PR AP mAP这些吧 对 这些指标就是衡量你方法好坏的标准。测这些值 在github上肯定有写好的代码的。
尾声
555,导师和师姐好耐心,我的那种蠢蛋问题也耐心的回复。
希望也能帮助到更多的小小白,早日成为炼丹小白。