【AI参赛经验】汉字书法识别比赛经验心得——by:microfat_htu

最新推荐文章于 2023-02-07 11:34:33 发布

AI科技大本营

最新推荐文章于 2023-02-07 11:34:33 发布

阅读量1.9k

点赞数

分类专栏：人工智能

本文链接：https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/80168994

版权

人工智能专栏收录该内容

543 篇文章 14 订阅

订阅专栏

各位人工智能爱好者，大家好！

由TinyMind发起的#第一届汉字书法识别挑战赛#正在火热进行中，比赛才开始3周，已有数只黑马冲进榜单。目前TOP54全部为90分以上!可谓竞争激烈，高手如林。不是比赛太简单，是大佬们太厉害了啊！

查看榜单

本次比赛主要是以学习交流为目的，吸引了不少萌新们报名参赛~虽是入门级别的赛题，对于没动手实战过的同学，还是有些不知所措。为此TinyMind特邀战场中目前排名第一的“microfat_htu”，为大家整理了参赛思路，以启发新手们如何开动，参与到本次书法识别比赛中。这位选手学业非常忙，在群里都妹有时间冒泡与大家交流，在此先预祝他考博顺利哈哈。

以下为参赛ID:microfat_htu 的经验分享

前一段时间在用迁移学习实现图像分类Github，正好赶上这次书法识别比赛，就想尝试用迁移学习的方法实现书法图像分类。本来没有抱太大希望，因为根据迁移学习理论，训练源域模型的数据应与训练目标域的数据有相似的特征分布，然而，ILSVRC数据集中并没有汉字符号类别，所以，期望的最好结果是能够收敛。但，事实出乎意料，不仅收敛，而且得到99.01%的测试准确率（看来我是低估深度模型的特征提取能力了）。

“link”（经验分享）和“真的学不会”（经验分享）同学的总结可以说是非常全面，由于时间能力有限，我在这只是简要介绍一下我的大致思路，供大家参考。

和“真的学不会”同学使用的keras不同，我使用的是slim，keras应用更广，slim更专一。在slim的readme上，提供了几乎所有目前主流深度模型的预训练模型，你可以选择任意模型下载，供你的项目使用。

首先，在Github的代码基础上，针对各自环境，对路径、类别数量、超参数（Github上的即比赛中我所使用的超参数）进行设置；另外，数据增广方法也需要修改（./preprocessing/inception_preprocessing.py），将随机翻转、剪裁取消，否则训练会特别慢；最后，在两个terminal下训练、验证，训练过程中会每隔一定时间（可自定义）输出checkpoint，模型验证程序会自动验证该checkpoint。截图如下。

左是训练，右是验证。

训练过程如下图所示：
这里写图片描述

从图中可以看到，loss并未完全收敛，还有继续下降的趋势，因而性能应该还有提升空间。

Note:

建议训练样本：验证样本=39：1，即，每类提取10幅图像构成验证集，以最大限度提高训练样本数；

我大概跑了100个epoch，选取比较新的checkpoint在测试集上测试，从测试结果上看，准确率相差不大，应该是收敛了，但继续跑的话应该还会有提升；

除了“真的学不会”同学推荐的书籍，我还比较推荐的是微博大v“爱可可-爱生活”，这个由北邮陈老师维护的公众号我关注了两年，受益颇多；

还有一个训练监控工具——Hyperdash，它可以实现网页、iOS、安卓端的训练实时监控，具体操作可以看他们官网（五一假期快来了，这个工具应该能帮到你?）。

最后，祝大家都能在此次比赛中有所收获。

源代码
链接地址：https://github.com/MacwinWin/Deep-Model-Transfer.git

欢迎对汉字书法识别感兴趣的同学踊跃参赛！竞赛地址：https://www.tinymind.cn/competitions/41

文章转自 #汉字书法识别挑战赛#经验分享 专栏

AI科技大本营

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
【AI参赛经验】汉字书法识别比赛经验心得——by:microfat_htu

各位人工智能爱好者，大家好！由TinyMind发起的#第一届汉字书法识别挑战赛#正在火热进行中，比赛才开始3周，已有数只黑马冲进榜单。目前TOP54全部为90分以上!可谓竞争激烈，高手如林。不是比赛太简单，是大佬们太厉害了啊！查看榜单本次比赛主要是以学习交流为目的，吸引了不少萌新们报名参赛~虽是入门级别的赛题，对于没动手实战过的同学，还是有些不知所措。为此TinyMind特邀战...
复制链接

扫一扫