2018百度西交大大数据竞赛-商家招牌的分类与检测

最新推荐文章于 2022-11-09 22:28:40 发布

京局京段蓝白猪

最新推荐文章于 2022-11-09 22:28:40 发布

阅读量4.3k

点赞数 3

分类专栏：图像处理深度学习比赛与数据

本文链接：https://blog.csdn.net/u013063099/article/details/80533694

版权

深度学习同时被 3 个专栏收录

19 篇文章

订阅专栏

图像处理

14 篇文章

订阅专栏

比赛与数据

3 篇文章

订阅专栏

【比赛官网】http://dianshi.baidu.com/gemstone/competitions/detail?raceId=17

【赛题简介】现实生活中的招牌各种各样，千变万化。针对初赛，在现实世界中，选取100类常见的招牌信息，如肯德基、麦当劳、耐克等。每类招牌挑选出10～30张图像作为训练数据，5～10张图像作为测试数据。参赛者需要根据训练集，构建算法模型，然后针对测试集进行分类，将最终的分类结果上传到比赛平台。

【队伍名称】Legendary

【GitHub】https://github.com/wfdubowen/2018-BD-XJD

【数据下载】https://blog.csdn.net/u013063099/article/details/79467531

【目前最优线上评分】0.991

【目前线上排名】78/1139（可怕。。。刚刚进复赛，0.99的排到了100开外。。。）

【参赛记录】log.txt

==========================================================================
2018百度西交大大数据竞赛-商家招牌的分类与检测
==========================================================================

20180508：代码V1.0上线（PyTorch版）。增加log.txt记录修改信息。
20180509：使用ResNet50（迁移），线上评分0.947。
20180510：V1.1数据增强，对训练集图片做了左右镜像、顺时针旋转以及逆时针旋转（train_improve_v1）。
20180511：使用ResNet152（迁移），线上评分0.958，后面默认使用该模型。
20180512：使用Inception-ResNet-V2，线上评分0.939，最优仍为0.958。
20180514：讨论后续调整方案：继续数据增强或者改用其他网络模型。
20180515：编排出100个类别对应的商标。尝试提交其他模型的预测结果，提交后线上评分0.948。
20180516：V1.2增加高斯模糊（2、3、4倍）之后（train_improve_v2），提交线上评分0.971。
小组讨论，针对现有的问题（例如过拟合、网络是否过深、训练集与验证集分开）进行讨论。
20180517：V1.3增加10度、15度、20度正负旋转之后（train_improve_v3）提交，准确率0.978。
V1.4增加颜色增强、提高对比度、提高亮度（1.5倍、2倍）之后（train_improve_v4）再次训练。
生成第一版图像处理文件（image_preprocessing.py）。
20180518：上传TensorFlow测试后结果。结果不理想。
20180519：上传V1.4结果，得分仅有0.971。
20180521：使用Xception网络训练，上传V1.4结果。结果为0.901。
20180522：使用Xception网络训练，上传V1.3结果。结果为0.838。
20180523：使用Inception-Resnet-V2网络训练，上传V1.4结果。结果为0.882。
20180524：使用Inception-Resnet-V2网络训练，上传V1.3结果。结果为0.796。
20180530：根据最好结果找出了22张错误图片，针对错误类型分析原因。
针对训练集分出验证集可能存在的问题（某一类分到验证集多，某一类少），尝试不设置验证集。
针对RandomResizeCrop可能存在裁剪掉重要信息，尝试使用OpenCV对图片重新放缩。
重新使用ResNet152训练V1.4（不设置验证集），以及使用Densenet201重新训练（带验证集）。
20180531：V1.4全部使用ResNet152训练的得分为0.978。Densenet201训练之后的经过对比发现错误图片较多。
使用V1.4经过OpenCV转换（224*224）的图片进行训练（ResNet152），不设置裁剪旋转等。
20180601：V1.4版本，经过OpenCV转换，不设置验证集的线上评分为：0.987。尝试再使用SENet154训练。
20180605：讨论使用小型网络、模型融合、灰度处理等方法。首先使用灰度处理进行尝试。SENet154线上也是0.987。
20180606：灰度处理之后的V1.4版本，OpenCV转换为224*224，不设置验证集的线上评分为：0.99。
20180607：使用之前训练出的两个0.987（Resnet152-All-Trained-SGD-V4-out_test.csv、
SENet154-All-Trained-SGD-V4_test.csv）与0.99的（Resnet152-All-Trained-SGD-V4-Gray_test.csv）
进行简单投票，并提交，线上得分0.991。

==========================================================================

【整理后的100个类别分类】