OCR:是Optical Character Recognition
的英文首字母缩写,意思是:光学字符识别,下面是百度百科词条OCR的解释:
指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
重点加了下颜色,主要意思就是将图片/照片中的文字识别出来,放到可编辑的文档中;
一般可以用来扫描书籍、扫描纸质文档,获取里面的文字到计算机中,再进行编辑修改;
现在很多用来在拍照后,将照片上传到应用了OCR的某些网站,然后识别出照片里的文字,常见的翻译软件,拍照取词也是用了这个技术;
现在的PDF转word应该也要用到这个技术,特别有些PDF是一些照片的集合,要转成word更需要这个技术了;