工作记录--在VecanLab的第484天

工作中遇到的困难以及一点解决思路

这周由于是考试周,工作进展基本处于停滞状态。上周三开完组会和王老师、师弟讨论了深度学习模型在数据集风格改变后效果不好的原因,事实证明模型是好的,只是用的不对。思考我做的交通标志检测方面的工作应该如何写出来,发现没有什么创新之处,无从下笔。挣扎着修改代码,统计准确率,但小修小改也并不能改变没有创新点的事实。大作业和考试结束了。从carmaker导出了带红绿灯的图像,拿来在训练得不是很好的模型上测了一下,效果很差。原因是我训练模型使用的数据集是包含的图片数量少。

关于交通标志检测

从一年半之前开始做的这方面的工作,一学期在用SSD,之后改用YOLO,在YOLO基础上做修改,尝试过把YOLO内部shortcut的部分从原来的add变为concatenate,也尝试过把YOLO的输出改为hyper-class,然后用densenet做细分类,还尝试了中间加形状和颜色特征提取精确定位,然后分类。尝试过各种方式的数据增强。

问题在于每一种方法的使用都是摸着石头过河,不知道哪一个参数应该调,哪一个参数不应该调。效果达不到现在的各种论文中所说的那么高的准确率。主要是召回率低,漏检多。

一个思路是把之前所做的各种方法在统一的数据集下在相同种类的交通标志类别上测试每一类别的recall和precision,计算三种方法的mAP,最后得到一个效果最好的。除了在公开的数据集上测试,还可以在车载摄像头采集的图像上做对比。

关于红绿灯检测

红绿灯检测试了两种方法,一种是在原来YOLO网络的基础上做,一种是使用Tensorflow Object Detection提供的各种架构。使用前者试了用了LISA数据集的一部分训练,效果一般,漏检比较多。使用后者训练还是有问题,即使使用少量数据也会报错OOM。

之前花了很长时间解决了Tensorflow Object Detection API数据准备的问题,以为终于可以开始训练使用了,还是遇到了新的问题。感觉这个API使用起来太麻烦,代码可读性比较低,决定放弃使用这种方法。

剩下前一种方法,目前能想到的改进方法就是用更多的数据去做训练,加上目标跟踪,整合两个步骤的代码。但这又成了不断调用别人的东西而没有一个自己的创新点。

上面两个方向的问题根本原因都是我的基础太差。

关于科研道路和辩证思考

首先,在老师给我一个课题之后,目标不是怎么用自己所学的知识去一步一步解决,而是想直接用一个别人做好的东西来解决。原因一方面可能是时间少,另一方面真的是自己懒,害怕去学习新的东西,用新的东西解决问题,总是希望能有一个懂的人带,这种心态不可取,需要改变心态。

把一个问题建立数学模型,设计算法来解一个优化问题,算法行不行的通需要用程序来验证,得到的结果怎么评估,怎么写代码来评估,怎么可视化结果,这些每一步我都没有自己从零开始系统地学习或者钻研过。原因何在?还是回到时间问题和心态问题。如果花一段时间单纯学习数学基础,比如概率统计、数学建模,再学习算法,各种优化算法,把机器学习的算法自己写代码跑一遍,我相信自己回头再看目标检测的问题会有更多的思路,也会更有自信。但是时间还是一个问题。我回想之前的学习过程,时间大都花在了整理数据集上,调之后根本不知道能不能用的上的代码,准备各种格式的数据,把图片做各种变形。时间没有用在刀刃上,还是要及时调整,要思考怎么做事更高效。

事情总是会一件一件地做,希望能够把心态调整好,把时间安排好,希望能把基础再学一学。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值