街景字符编码识别赛题理解

最新推荐文章于 2020-08-10 21:49:09 发布

wgj839977837

最新推荐文章于 2020-08-10 21:49:09 发布

阅读量177

点赞数

分类专栏：目标检测文章标签：深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wgj839977837/article/details/106243215

版权

目标检测专栏收录该内容

3 篇文章 0 订阅

订阅专栏

街景字符编码识别赛题理解

赛题数据
问题

赛题数据

赛题的数据为街景字符图片，类似于MNIST数据集，但是更加困难，每张图片分辨率都很低，图片中的字符有大有小，存在尺度不一致的问题；按照赛题的要求只要识别是每张图片包含几个字符，每个字符是什么就可以了，这样可以简单将其定义为一个图像分类问题，但是每个图片的字符个数不确定，而且位置不确定，因为每个字符的类别仅仅与相应的局部的特征有关，仅仅通过对全局的特征进行分类并不能得到很好的效果；并且通过亲自实验, 完成baseline代码的阅读和理解,并完成在训练集训练10个epoch, 效果很差
其次赛题数据不仅提供了字符类别也提供了每个字符的位置信息，所以也可以将改题定义为目标检测问题，利用同时分类和回归的多任务损失，对每个指定位置进行针对性的分类和回归，两种任务进行相互促进，彼此收益可以取得更好的效果．

问题

如果采用目标检测的思路，个人认为应该选取针对小目标的backbone作为特征提取器，要包含多尺度的特征融合的策略，检测头的话可以采用当前精度比较好的anchor free方法这样可以避免复杂的关于anchor超参的设计，同时可以支持多尺度的边界框回归

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
街景字符编码识别赛题理解

街景字符编码识别赛题理解赛题数据问题赛题数据赛题的数据为街景字符图片，类似于MNIST数据集，但是更加困难，每张图片分辨率都很低，图片中的字符有大有小，存在尺度不一致的问题；按照赛题的要求只要识别是每张图片包含几个字符，每个字符是什么就可以了，这样可以简单将其定义为一个图像分类问题，但是每个图片的字符个数不确定，而且位置不确定，因为每个字符的类别仅仅与相应的局部的特征有关，仅仅通过对全局的特征进行分类并不能得到很好的效果；其次赛题数据不仅提供了字符类别也提供了每个字符的位置信息，所以也可以将改题定义为
复制链接

扫一扫

专栏目录

wgj839977837 CSDN认证博客专家 CSDN认证企业博客

码龄8年

5: 原创

67万+: 周排名

130万+: 总排名

4798: 访问

: 等级

99: 积分

0: 粉丝

1: 获赞

1: 评论

7: 收藏

私信

关注

热门文章

分类专栏

目标检测 3篇

最新评论

关于坐标旋转平移理解
142857_T: 补充，对于齐次变换矩阵 T3 = T1*T2，先按1变换，再按2变换

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。