01 什么是OCR?
OCR「Optical Character Recognition」,光学字符识别即:OCR文字识别。
指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;
即针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
02 OCR文字识别技术的应用领域
l证件识别、车牌识别
l智慧医疗
lpdf文档转换为Word
l拍照识别、截图识别、网络图片识别
l无人驾驶
l无纸化办公、稿件编辑校对
l物流分拣
l舆情监控
l文档检索
l字幕识别
l文献资料检索等
03 OCR文字识别的一般流程
OCR文字识别主要分为印刷体文字识别和手写体文字识别。
OCR文字识别技术的手段多种多样,各个识别过程也是不尽相同,这里简要介绍文字识别方法的一般流程。
l