文通表格票据识别系统介绍

北京文通科技有限公司简介

文通科技,源于清华,服务全球。

我们的使命就是要为您提供最好的文档图像识别管理服务,打造信息无障碍对接平台,促进信息更好更快的交流。

北京文通科技有限公司是在原国家科委的支持下,为推广应用清华大学电子工程系的科研成果——“863高科技计划”信息领域多字体印刷汉字自动识别技术而成立的集科研、生产、销售为一体的企业。文通科技是国内外知名的OCR技术生产商、文档影像技术和应用解决方案提供商,也是北京市科委认定的软件企业和高新技术企业。在与清华大学电子工程系智能图文实验室的携手合作过程中,文通科技成功地将“国家863计划”项目成果——“文字图像识别技术TH-OCR”产业化,真正实现了TH-OCR技术与市场应用的完美结合。

  • 1992——公司成立   北京市清华文通信息技术公司

 

  • 1999——整体改制  北京市清华文通信息技术有限公司

 

  • 2000——公司重组  北京清华紫光文通信息技术有限公司

 

  • 2004——股权变更  北京文通信息技术有限公司

 

  • 2008——公司成立  北京文通科技有限公司

 

人员构成:目前,公司拥有员工近300人,从事研发工作近150人,强大的知识源泉和人才优势使公司处于业界领导者的地位。

研发力量:依托强大的清华科技研发力量——清华大学电子工程系智能图文信息处理研究室,文通科技以工程院院士吴佑寿为首,在博士生导师丁晓青教授领导下,长期致力于清华TH-OCR的研究与开发,其中亚洲文字(中文简体、中文繁体、日文、韩文)始终位居世界领先,是海内外文档图像识别领域最优秀的研究机构之一。特别是文通科技的“清华TH-OCR”,在国内IT界享有较高声誉,已经成为汉字、图档识别的代名词。

技术背景:OCR是英文Optical Character Recognition的缩写,意思为光学字符识别,通称为汉字识别,它的工作原理为通过扫描仪或数码相机等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并按通用格式存储在文本文件中,由此可看出,OCR实际上是让计算机认字,实现文字自动输入。它是一种非常快捷、省力的文字输入方法。TH是TsingHua的缩写,TH-OCR代表文通公司开发的OCR软件。

技术历史:清华TH-OCR是清华大学电子工程系在“863”计划、“七.五”攻关计划、自然科学基金和军事基础研究课题支持下,从1985年开始十多年的科研成果,是当今最好的中文文字识别产品。

技术成就:作为国内文档图像识别领域的领导厂商,文通科技坚持技术创新,在OCR(optical character recognition)、嵌入式手写等相关领域取得丰硕的研究成果,先后成功研发出多体汉字识别、汉英混排文体识别、多文种印刷/手写全能文本自动识别、联机手写汉字识别、脱机手写汉字/数字识别、票据识别、表格识别、证件识别、车辆号牌识别和网络OCR等技术。规范的科学管理使公司顺利通过“ISO9000质量认证”。

除了自主研发之外,文通科技还坚持发展与海内外公司的技术合作,公司先后同IBM、Microsoft、西门子、诺基亚、Intel、HP 、Motorola、Scansoft等许多国际著名公司开展合作。亚洲文字(中文简体、中文繁体、日文、韩文)识别技术更是得到了微软的高度认可,并在微软Office 2003中全面配装。

市场应用:多年来,文通人一直倡导着“文字录入不用手”的理念,在技术创新的基础上,文通科技还积极与市场应用紧密结合,全面实现了科研成果的产品转化。目前,文通科技已有五大系列、20多种产品投向市场,主要有:TH-OCR录入工厂、IT-Doc公文高速录入系统、IT-Scan图档易扫通、文通快证通证件识别系统、小灵鼠-手写识别软件、文通快号通车牌识别系统、文通票据表格识别系统等。尤其是在行业应用市场,依靠十余年的经验积累和对行业用户需求的不断探索,文通科技已经在金融、税务、工商、电力、公安、电子政务等多个领域取得了成功应用,并在相关行业的推广及应用中起典范作用,为我国信息化建设的顺利进行奠定了坚实的基础。

银行票据系统介绍

文通银行票据识别系统特性

文通银行票据识别系统是北京文通公司在TH-OCR识别核心的基础上开发的表格识别软件,其不仅可以完成金融领域风险监督系统中银行票据影像的OCR识别,并且可以实现其它表格类影像的自动识别(如各种申请表、测评表、定单、保险单等)。票据识别系统有两部份组成:表格模板编辑器和表格分类识别核心。其中表格模板编辑器完成表格模板的定制工作,并由识别模板指导识别核心进行影像分类和识别。

模板分类精细、准确率高

模板分类的准确率达到98%左右,规范凭证模板分类准确率超过99%;字段识别率高,单流水字段的识别率高于90%。银行票据识别系统不仅可以完成一种凭证打印同一种交易的模板分类,并可以完成同一种凭证打印多种交易以及同一种凭证分多联的凭证分类。本系统充分利于了凭证的标题、框线、打印文本等多种特征进行模板的区分。

支持多种字符类型的识别

印刷体汉字、印刷体英文数字、手写汉字、手写数字、磁码、复选框、条码识别(一维条码支持:Code39, Code128, Code32, EAN-128, EAN-13 and JAN, EAN-8, UPC-A, UPC-E, Add2, Add5, BCD Matrix等;二维条码支持:PDF417和 DataMatrix)等。

转载于:https://my.oschina.net/u/4180524/blog/3084752

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值