已经感觉一个月没有更博了,最近也是在找工作找实习。最近在看的就是如何使用神经网络去做一个OCR识别,网上的资料多种多样,包括分割单字进行识别的,也有不定长文字识别。网络模型目前看到比较多的是CRNN,检测的模型包括CTPN、YOLO等等。
今天整理的是数据预处理上的文本透视矫正与水平矫正。
一、透视矫正
透视矫正是什么?比如发现了一页纸,写的挺好,你想拍下来,但是拍摄时角度的问题,你拍成了下面左边的样子,但是你本来想的是从纸的正上方去拍,所以你要想办法去把照片矫正成右边的样子,矫正的过程称为透视矫正。
---------------------
作者:京局京段蓝白猪
来源:CSDN
原文:https://blog.csdn.net/u013063099/article/details/81937848?utm_source=copy
版权声明:本文为博主原创文章,转载请附上博文链接!