CASIA-HWDB2.x（offline）数据集合并为page类型，并标出行级别的bbox

置顶

Pywin

于 2020-09-30 11:05:53 发布

阅读量1.2w

点赞数 5

分类专栏： pytorch 文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36076233/article/details/108880987

版权

最近要做行级别的手写文件检测工作，将CASIA-HWDB2.x（offline）数据进行合并，生成了page level的数据集，还带有相应的bbox。如果大家想交流ocr相关的工作可以加群（文章末尾）：

CASIA-HWDB2.x（offline）数据集下载地址：http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html

我所下载的是这一部分：

CASIA-HWDB2.x（offline）数据集解析可以参考：https://www.freesion.com/article/6894959465/

解析完后HWDB2.xTrain_images下的图片：

图片预览：

001-P16_0.jpg：

解析完后HWDB2.xTrain_label下的label：

label预览：

001-P16_0.txt：

2002年以来,国内企业家包括许多著名企业家在内涉嫌违法犯罪被捕入

现在进入主题，将解析好的图片拼接成整页的形式：

001-P16，page结果预览：

最低0.47元/天解锁文章

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。