【AI参赛经验】汉字书法识别比赛经验心得——by:microfat_htu

各位人工智能爱好者,大家好!

由TinyMind发起的#第一届汉字书法识别挑战赛#正在火热进行中,比赛才开始3周,已有数只黑马冲进榜单。目前TOP54全部为90分以上!可谓竞争激烈,高手如林。不是比赛太简单,是大佬们太厉害了啊!

查看榜单


这里写图片描述

本次比赛主要是以学习交流为目的,吸引了不少萌新们报名参赛~虽是入门级别的赛题,对于没动手实战过的同学,还是有些不知所措。为此TinyMind特邀战场中目前排名第一的“microfat_htu”,为大家整理了参赛思路,以启发新手们如何开动,参与到本次书法识别比赛中。这位选手学业非常忙,在群里都妹有时间冒泡与大家交流,在此先预祝他考博顺利哈哈。

以下为参赛ID:microfat_htu 的经验分享

前一段时间在用迁移学习实现图像分类Github,正好赶上这次书法识别比赛,就想尝试用迁移学习的方法实现书法图像分类。本来没有抱太大希望,因为根据迁移学习理论,训练源域模型的数据应与训练目标域的数据有相似的特征分布,然而,ILSVRC数据集中并没有汉字符号类别,所以,期望的最好结果是能够收敛。但,事实出乎意料,不仅收敛,而且得到99.01%的测试准确率(看来我是低估深度模型的特征提取能力了)。

“link”(经验分享)和“真的学不会”(经验分享)同学的总结可以说是非常全面,由于时间能力有限,我在这只是简要介绍一下我的大致思路,供大家参考。

和“真的学不会”同学使用的keras不同,我使用的是slim,keras应用更广,slim更专一。在slim的readme上,提供了几乎所有目前主流深度模型的预训练模型,你可以选择任意模型下载,供你的项目使用。

首先,在Github的代码基础上,针对各自环境,对路径、类别数量、超参数(Github上的即比赛中我所使用的超参数)进行设置;另外,数据增广方法也需要修改(./preprocessing/inception_preprocessing.py),将随机翻转、剪裁取消,否则训练会特别慢;最后,在两个terminal下训练、验证,训练过程中会每隔一定时间(可自定义)输出checkpoint,模型验证程序会自动验证该checkpoint。截图如下。


这里写图片描述

左是训练,右是验证。

训练过程如下图所示:
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

从图中可以看到,loss并未完全收敛,还有继续下降的趋势,因而性能应该还有提升空间。

Note:

建议训练样本:验证样本=39:1,即,每类提取10幅图像构成验证集,以最大限度提高训练样本数;

我大概跑了100个epoch,选取比较新的checkpoint在测试集上测试,从测试结果上看,准确率相差不大,应该是收敛了,但继续跑的话应该还会有提升;

除了“真的学不会”同学推荐的书籍,我还比较推荐的是微博大v“爱可可-爱生活”,这个由北邮陈老师维护的公众号我关注了两年,受益颇多;

还有一个训练监控工具——Hyperdash,它可以实现网页、iOS、安卓端的训练实时监控,具体操作可以看他们官网(五一假期快来了,这个工具应该能帮到你?)。

最后,祝大家都能在此次比赛中有所收获。

源代码
链接地址:https://github.com/MacwinWin/Deep-Model-Transfer.git

欢迎对汉字书法识别感兴趣的同学踊跃参赛!竞赛地址:https://www.tinymind.cn/competitions/41

文章转自 #汉字书法识别挑战赛#经验分享 专栏

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值