【场景文本检测】paper里的实验参数和数据集选择

最新推荐文章于 2022-10-06 11:33:19 发布

Patrick Star1

最新推荐文章于 2022-10-06 11:33:19 发布

阅读量639

点赞数 1

分类专栏：论文代码研读 OCR方向

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35307005/article/details/102751757

版权

OCR方向同时被 2 个专栏收录

13 篇文章 2 订阅

订阅专栏

论文代码研读

9 篇文章 5 订阅

订阅专栏

前言：

由于实验需求，记录一下最近（主要19年）场景文本检测的实验的实现细节和数据集选择。

常用的预训练模型

pre-train：

synthtext （800k） 1epoch
IC17 MLT（7200）40 epoch (psenet spcnet)

多尺度训练

PSEnet: ：缩放旋转水平翻转随机裁剪

常用参数

名称	一阶学习率	二阶学习率	batch size	迭代次数	数据集	其他
PSEnet	0.001	0.0001	16	36k iteration	synth、MLT	-------

常用的不规则文本数据集

名称	训练集	验证集	测试集	特点	文本形状
ICDAR 2013	462	229	233	字符级	水平
ICDAR 2015	1000	——	500	字符级	任意四边形
ICDAR 2017 MLT（*）	7200	1800	9000	字符级	多语言
Total-Text (*)	1255	——	300	----	水平，多方向，弯曲
CTW1500	1000	——	500	文本行	14点多边形
SynthText	800k	——	——	-----	合成数据集
MSRA-TD500	500	300	200		弯曲文本

预训练方法1 ：2017MLT
预训练方法2 ：合成数据集（AAAI 2019）
预训练方法3：全部训练集一起

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
【场景文本检测】paper里的实验参数和数据集选择

常用的数据集名称训练集验证集测试集特点ICDAR 2013ICDAR 20151000——500ICDAR 2017 MLT720018009000Total-Text1255——300CTW15001000——500...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。