关于数据增强,还有数据集的扩充的一些看法
由于这段时间导师任务比较重,对于这个比赛我只能大体说下我的看法,至于上手实践,可能需要过段时间有更多的空余时间后才能上手了。但是自己也不想被移出群而错过大佬们的答疑还有资料分享等等,因为虽然自己还没那么多时间去实践,但是偶尔看看大佬们的答疑还是有用的,毕竟三人行必有我师嘛,有些自己不懂的知识也许就会在这不经意间在群里得到解决呢?毕竟这也是对自己多多少少的一种提高吧。
从数据增强方面改进
比赛指定用的官方规定的数据集,所以要想获取更高的成绩,其中一个很重要的方面就是基于原数据集的基础上如何变换出更多的训练数据,所以这里就有一个想法就是能不能将图像的一些变换加进来,就是在数据集训练之前对此进行图像的一些基础的变换,比如对图像进行不同角度的旋转,腐蚀后再旋转,或者仿射变换后再旋转各种角度等等。这样操作后数据集应该会比原来的数据集更加庞大,从而可能使模型跑出更好的精度结果。除此之外把数据集划分为训练集、验证集还有测试集三个也有可能会带来一些改善吧。
从模型本身进行改进
除了以上改进方法之外,我觉得还有可能改进的地方就是选择更好的模型,也许还有比baseline更好的模型呢?这个谁也说不准。另外可不可以修改下模型的激活函数?Relu确实是比较通用的激活函数,能否用tanh来代替试一下,或者leaky Relu呢?谁也说不准修改了这些能带来怎样的影响,估计只有实践过才知道吧。
以上就是我暂时能想到的改进方向,由于个人忙于其他事情没有充足的时间去实践验证,也不知道这些方向能不能管用就是了