OCR
Kevin NuNu
算法小白的救赎之路。
展开
-
【OCR炼丹】解析CASIA数据集OLHWDB部分Python版完整代码
上一篇记录了HIT-OR3C联机数据的解析代码,由于OLHWDB不同于HIT-OR3C,其在采集联机手写体数据时就没有按照固定size去采集(HIT-OR3C保存的坐标是转换后相对128*128大小画布的相对坐标),而是一个绝对坐标(解析的第一个sample的y就有6000多,以为搞错了就扔一边了)这周重新打开仔细研究了下官方POTView的C++源码,终于是把CASIA的OLHWDB数据解析...原创 2020-01-07 17:41:27 · 2784 阅读 · 12 评论 -
【OCR炼丹】解析HIT-OR3C数据集online部分Python版完整代码
最近开始炼手写体汉字识别方面的丹,网上找了下数据集,主要有:中科院自动化研究所开源的CASIA数据集(下载链接地址) 哈工大开源的HIT-OR3C数据集(下载链接地址)这俩数据集的存储形式与之前接触过的一些共有数据集的保存形式有很大的区别,对于C、C++不是很熟用Python较多的我来说踩了不少的坑(还都是CSDN、知乎、Google都搜不到的巨坑),造福下后来人吧。首先,明确一点,由...原创 2019-12-30 01:54:34 · 1230 阅读 · 4 评论