【OCR炼丹】解析HIT-OR3C数据集online部分Python版完整代码

最新推荐文章于 2022-10-17 09:46:24 发布

Kevin NuNu

最新推荐文章于 2022-10-17 09:46:24 发布

阅读量1.1k

点赞数 2

分类专栏： OCR 文章标签： Python HIT-OR3C Online Handwritten Chinese Cha 联机手写体字符集 OCR

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangnu_043/article/details/103759375

版权

最近开始炼手写体汉字识别方面的丹，网上找了下数据集，主要有：

中科院自动化研究所开源的CASIA数据集（下载链接地址）
哈工大开源的HIT-OR3C数据集（下载链接地址）

这俩数据集的存储形式与之前接触过的一些共有数据集的保存形式有很大的区别，对于C、C++不是很熟用Python较多的我来说踩了不少的坑（还都是CSDN、知乎、Google都搜不到的巨坑），造福下后来人吧。

首先，明确一点，由于博主此次研究的主要以联机手写体识别为主，所以主要重点关注的是CASIA数据集的OLHWDB数据以及HIT-OR3C的Online Characters。

第一坑：数据存储形式不了解

CASIA数据集其offline部分的字符集(.gnt格式数据)解析网上有相关python解析代码，但是online部分的字符集(.pot格式数据集)没找到有大神开源的解析代码。发邮件询问了数据集的作者，了解到了.pot格式的数据集要按照一定的规则依次读取相应的字节来解析（规则详见官网），并且作者还慷慨地提供了官方可视化工具的C++源码（让我对照着用Python去解析，奈何C++水平不够卡在最后一步，如果后续解析成功了会开源解析代码）

由于HIT-OR3C数据集的online部分字符集的存储形式与CASIA的OLHWDB存储格式类似，并且提供了File Format Specification以及C++，JAVA，Matlab三种语言的解析代码（奈何还是没有Python...还好博主本科Matlab用的多看得懂，才得以最终用Python解析成功）

最低0.47元/天解锁文章

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
4
评论
【OCR炼丹】解析HIT-OR3C数据集online部分Python版完整代码

最近开始炼手写体汉字识别方面的丹，网上找了下数据集，主要有：中科院自动化研究所开源的CASIA数据集（下载链接地址）哈工大开源的HIT-OR3C数据集（下载链接地址）这俩数据集的存储形式与之前接触过的一些共有数据集的保存形式有很大的区别，对于C、C++不是很熟用Python较多的我来说踩了不少的坑（还都是CSDN、知乎、Google都搜不到的巨坑），造福下后来人吧。首先，明确一点，由...
复制链接

扫一扫

专栏目录

Kevin NuNu CSDN认证博客专家 CSDN认证企业博客

码龄7年

7: 原创

25万+: 周排名

65万+: 总排名

2万+: 访问

: 等级

334: 积分

24: 粉丝

25: 获赞

29: 评论

120: 收藏

私信

关注

分类专栏

OCR 2篇
架构知识 1篇
PyTorch学习 4篇

最新评论

【OCR炼丹】解析CASIA数据集OLHWDB部分Python版完整代码
星空的力量: 博主您好，我在解析之后输出文件夹里没有图片这是怎么回事呢？
【OCR炼丹】解析CASIA数据集OLHWDB部分Python版完整代码
星空的力量: 博主您好，我在解析之后输出文件夹里没有图片这是怎么回事呢？
【PyTorch学习】（一）ResNet源码研读
haohaolalahao: 我一直不理解，residual为什么没做1*1的卷积？这样根本加不回去吧
【OCR炼丹】解析CASIA数据集OLHWDB部分Python版完整代码
方水云: 你好，请问dataset_name+'trn_pot'和dataset_name+'tst_pot'是什么？？我没有pot文件，只有wptt格式文件。
【OCR炼丹】解析HIT-OR3C数据集online部分Python版完整代码
Gesshoku: 想问一下离线的怎么解析

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。