飞桨深度学习集训营学习心得

飞桨深度学习集训营学习心得

1. 学习心得

本次第一阶段的深度学习活动主要囊括了包括房价检测,手写数字,眼疾识别,AI识虫等多个CV方向的实践。基于PaddlePaddle框架在AIStudio平台上进行了相关的实践,这次学习所获得的新技术,主要包括如何基于paddlepaddle框架,采用动态图方式实现从数据读取、数据预处理到模型构建、模型训练的全过程。

最后的CV检测比赛还是比较具有挑战性的,之前基本没有打过检测相关比赛,只做个几个图像分类识别的练习赛,可以说是从0开始。整体经历了如下几个阶段:

  • 第一阶段:摸索熟悉阶段
    这一阶段 ,主要基于老师提供的baseline,熟悉了数据集的形式,yolov3的基本框架,基本能够把代码跑起来提交初步结果。
  • 第二阶段:调节参数阶段
    这一阶段,主要基于baseline通过对于数据增强(包括翻转,打乱,crop等操作),以及优化器调节,提高结果。
  • 第三阶段:框架改进阶段
    这一阶段,主要涉及到对于backbone的改进,通过一定的搜索调研采用了PaddleDetection这一基于Paddle开发的平台,将backbone换为了Resnet50_vd_dcn的backbone通过引入可变形卷积和基于object365的预训练权重提高效果,并进一步采用mixup的trick提高效果。
  • 第四阶段:茫然焦虑阶段
    通过第三阶段的尝试将MAP基本提高到91.8左右,然后卡了很久,尝试了很多新的办法包括二阶段模型faster-rcnn,cascade-rcnn,数据集旋转,anchor改进都没有获得比较明显的收益,这一阶段经历了从一开始的榜单靠前逐步下降到15开外的过程。
  • 第五阶段:数据为王,逼上梁山
    这一阶段时已经是最后三天了没有显著提高,排名在16左右,此时认识到类别中存在标签的问题即label里的index=2,6的label只是大小写的区别,因此考虑到可能是同一类的数据,通过对于标签的合并又进一步提高了2个点,大概到93左右。最后一天,为了充分利用数据将val数据也放入训练集中进行了训练提高到95左右。此时发现框重复较多,于是又对NMS的保留框数进行了调解基本落在14-16之间的范围,可以提高到96。

2. 飞桨使用体验

由于之前的学习通常采用的都是tensorflow和keras框架,刚上手时有点别扭,但整体上使用还比较流畅,paddle也提供了tensorflow,pytorch函数在paddle中对应的函数,切换过程也比较方便,但是也有一些问题,比如实际的文档有所偏差,某些功能只能作用于静态图而不能作用于动态图但是却没有明确标识。

另外,本次CV比赛引入PaddleDetection框架也发现PaddleDetection的github社区的响应速度不是很高,提的issue回复非常不及时,还是在一个群里找老师帮忙催了后才有回复。其次,paddledetection没有一个比较完整的数据处理,训练配置修改的文档,实际使用更多的是参考已有的数据集和config配置文件进行修改,非常不方便,希望能有个系统性的文档。

3. 课程的意见

整个CV部分的课程整体上市比较好的,有非常多的代码实践。同时在算力侧提供AIStudio的V100算力卡支持学习,非常的棒。但是,感觉内容上也有部分没能够涉及,比如说模型训练好了,如何进行部署,移动端的模型压缩等等,希望后续的课程能够提供这部分的内容。

4. 中间过程成果展示

作业截图1
作业截图2
作业截图3

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值