OCR（Optical Character Recognition 光学字符识别）扫盲

本文链接：https://blog.csdn.net/qq_41853758/article/details/82860232

OCR（光学字符识别）是一种利用光学技术将文字转化为计算机内码的技术。起源于20世纪，中国在70年代开始汉字识别研究，现广泛应用在办公自动化、资料库建立、打字公司等领域。OCR识别率高，能识别多种字体和表格，专业版功能更强大，适用于特定行业。随着技术发展，OCR将在更多领域发挥作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

了解OCR

OCR是英文Optical Character Recognition 的缩写，中文意思就是通过光学技术对文字进行识别。OCR概念的产生是在1929年，德国的科学家Tausheck首先提出了OCR的概念，并且申请了专利。几年后，美国科学家Handel也提出了利用技术对文字进行识别的想法。但这种梦想直到计算机的诞生才变成了现实。现在这一技术已经由计算机来实现，OCR的意思就演变成为利用光学技术对文字和字符进行扫描识别，转化成计算机内码。
　我国在OCR技术方面的研究工作起步较晚，在70年代才开始对数字、英文字母及符号的识别进行研究，70年代末开始进行汉字识别的研究，到1986年汉字识别的研究进入一个实质性的阶段，取得了较大的成果，不少研究单位相继推出了中文OCR产品。我国OCR都是有 OMR演变过来的，我国的一些研究部门在 80年代初就开始对OCR识别进行研究，如：清华的吴估寿教授、丁晓青教授、夏莹教授、北大的顾小凤教授、北信的张昕中教授、中科院的刘品平博士、李明敬博士可以称作我国OCR研究开发队伍中的导航人，为此付出了不懈努力。二十多年的研究开发积累了大量人才，专家就有上百人。在中关村的硅谷地带，我国的OCR专家多达20多位，他们也为我国的信息领域留下了自己奋斗的足迹。我国目前使用的文本型OCR软件主要有清华文通TH-OCR、北信BI-OCR、中自ICR、沈阳自动化所SY-OCR、北京曙光公司NI-OCR（已被中自汉王并购）等，匹配的扫描仪则使用市面上的平板扫描仪。
中文OCR即采用扫描仪、数码相机等输入设备，把中文印刷体的文稿送入计算机并以计算机文档表示出来的高新技术。中文印刷体识别技术（OCR）主要用于文字和表格输入，可以用扫描仪将整页的印刷文稿或者表格输入计算机，由计算机上的识别系统自动生