【比赛官网】http://dianshi.baidu.com/gemstone/competitions/detail?raceId=17
【赛题简介】现实生活中的招牌各种各样,千变万化。针对初赛,在现实世界中,选取100类常见的招牌信息,如肯德基、麦当劳、耐克等。每类招牌挑选出10~30张图像作为训练数据,5~10张图像作为测试数据。参赛者需要根据训练集,构建算法模型,然后针对测试集进行分类,将最终的分类结果上传到比赛平台。
【队伍名称】Legendary
【GitHub】https://github.com/wfdubowen/2018-BD-XJD
【数据下载】https://blog.csdn.net/u013063099/article/details/79467531
【目前最优线上评分】0.991
【目前线上排名】78/1139(可怕。。。刚刚进复赛,0.99的排到了100开外。。。)
【参赛记录】log.txt
==========================================================================
2018百度西交大大数据竞赛-商家招牌的分类与检测
==========================================================================
20180508:代码V1.0上线(PyTorch版)。增加log.txt记录修改信息。
20180509:使用ResNet50(迁移),线上评分0.947。
20180510:V1.1数据增强,对训练集图片做了左右镜像、顺时针旋转以及逆时针旋转(train_improve_v1)。
20180511:使用ResNet152(迁移),线上评分0.958,后面默认使用该模型。
20180512:使用Inception-ResNet-V2,线上评分0.939,最优仍为0.958。
20180514:讨论后续调整方案:继续数据增强或者改用其他网络模型。
20180515:编排出100个类别对应的商标。尝试提交其他模型的预测结果,提交后线上评分0.948。
20180516:V1.2增加高斯模糊(2、3、4倍)之后(train_improve_v2),提交线上评分0.971。
小组讨论,针对现有的问题(例如过拟合、网络是否过深、训练集与验证集分开)进行讨论。
20180517:V1.3增加10度、15度、20度正负旋转之后(train_improve_v3)提交,准确率0.978。
V1.4增加颜色增强、提高对比度、提高亮度(1.5倍、2倍)之后(train_improve_v4)再次训练。
生成第一版图像处理文件(image_preprocessing.py)。
20180518:上传TensorFlow测试后结果。结果不理想。
20180519:上传V1.4结果,得分仅有0.971。
20180521:使用Xception网络训练,上传V1.4结果。结果为0.901。
20180522:使用Xception网络训练,上传V1.3结果。结果为0.838。
20180523:使用Inception-Resnet-V2网络训练,上传V1.4结果。结果为0.882。
20180524:使用Inception-Resnet-V2网络训练,上传V1.3结果。结果为0.796。
20180530:根据最好结果找出了22张错误图片,针对错误类型分析原因。
针对训练集分出验证集可能存在的问题(某一类分到验证集多,某一类少),尝试不设置验证集。
针对RandomResizeCrop可能存在裁剪掉重要信息,尝试使用OpenCV对图片重新放缩。
重新使用ResNet152训练V1.4(不设置验证集),以及使用Densenet201重新训练(带验证集)。
20180531:V1.4全部使用ResNet152训练的得分为0.978。Densenet201训练之后的经过对比发现错误图片较多。
使用V1.4经过OpenCV转换(224*224)的图片进行训练(ResNet152),不设置裁剪旋转等。
20180601:V1.4版本,经过OpenCV转换,不设置验证集的线上评分为:0.987。尝试再使用SENet154训练。
20180605:讨论使用小型网络、模型融合、灰度处理等方法。首先使用灰度处理进行尝试。SENet154线上也是0.987。
20180606:灰度处理之后的V1.4版本,OpenCV转换为224*224,不设置验证集的线上评分为:0.99。
20180607:使用之前训练出的两个0.987(Resnet152-All-Trained-SGD-V4-out_test.csv、
SENet154-All-Trained-SGD-V4_test.csv)与0.99的(Resnet152-All-Trained-SGD-V4-Gray_test.csv)
进行简单投票,并提交,线上得分0.991。
==========================================================================
【整理后的100个类别分类】