原标题:中文简历表格提取,手写汉字识别(Python+OpenCV)
所有代码获取:
简历
网上对表格框的提取的相关资料较少,尤其是Python+OpenCV的实现方面。
整体流程
如今OpenCV官方的Document里都包含了各API的Python版用法,从C++转换到Python用起来意外的顺手。这里附上官方的在线Document地址,记得选对应版本:https://docs.opencv.org/
该部分的编译环境如下:
(1)Ubuntu16.04 64位 支持utf-8编码
(2)Python2.7
(3)OpenCV3.4.3 (与Python2.7编译通)
(4)Python2.7 numpy模块、PIL模块、logging模块、pickle模块、os模块、random模块、time模块、matplotlib模块、math模块、csv模块
读取表格图片文件
这段即将test_data文件中的所有文件进行遍历读取,也可注释最下方的两行,