文字识别
文章平均质量分 79
wolf_ray
这个作者很懒,什么都没留下…
展开
-
【Tesseract】Tesseract 的训练流程
为了方便 tif文面命名格式[lang].[fontname].exp[num].tif lang是语言 fontname是字体 比如我们要训练自定义字库 ec 字体名:unfont 那么我们把tif文件重命名 ec.ufont.exp0.tif生成 .box文件 tesseract ec.ufont.exp0.tif ec.ufont.exp0 batch.nochop makebox1原创 2016-05-02 16:34:30 · 1010 阅读 · 0 评论 -
【OpenCV】一种基于阈值的图片中的文字分割
在今年泰迪杯A题电商中图片的文字识别这道题中,我们先用了一种很笨的办法来分割字符。 首先对图片进行灰度化,然后二值化,这里的二值化要选择一个合适的阈值。然后我们进行轮廓的提取,计算轮廓最小矩形的面积,若面积过大,则认为这个是背景图片,若面积过小,则认为是噪点。这种方法有一个弊端,就是文字有大有小,大的文字也有可能会被当成背景,小的标点也可能会被当成噪点。代码如下: 实现了读入一张图片,进行灰度化原创 2016-05-21 22:09:20 · 5204 阅读 · 0 评论