在生活中会遇到以下场景:给定一张纸质版表格,或者图片表格,如何将其数字化,能够进行编辑。该如何进行操作呢?像打字员一样一个个重新打印一遍?使用OCR识别图中文字,在一点点复制到表格中,这些方法都可以。但如果表格有成千上万行怎么办呢,难道还一个个的打印吗?这次内容我们教你如何1分钟内解决此事。
机器学习识别表格
前面我们介绍了如何识别图片中的文字,然后将其转换为文本,可以进行编辑。识别表格同样的原理。其实就是应用了机器学习中的图片识别。当然有部分人tree new bee为人工智能,其实也没这么玄乎。原理并不难,既然都能识别图片区分出猫和狗。那么表格图片基本上只是黑白线条,识别起来应该更加容易。图片识别主要是将图片分割为像素点,根据像素点RGB的组合不同来进行区分。比如python中比较有名的OpenCV包就用来处理图片。Python+Opencv+pytesser可以开发程序识别图片。
当然了,这里不是要求大家人人都能开发程序,其实已经有很多能够识别图片表格的小工具了,直接摄像头拍照,然后直接就可以转换为excel表格,接下来我们就来介绍一下。
图片表格识别工具
目前已经有很多微信