读光OCR-文字识别技术解读与应用案例分析
摘要:大数据上云特惠活动系列直播,阿里巴巴高级算法专家永攀对读光OCR-文字识别技术和行业应用进行讲述。OCR的本质是识别图片中的文字,即在复杂的图片背景下中对所需目标文字进行识别提取。主要从OCR商业应用场景、OCR算法和读光产品进行了介绍。展示读光OCR在在文字识别中强大的应用。
数十款阿里云产品限时折扣中,赶快点击这里,领券开始云上实践吧
直播视频请点击
下载PPT请点击
更多印刷文字识别OCR相关信息请点击
OCR商业应用场景
OCR的本质是识别图片中的文字。根据需要处理的数据类型可以分为四种数据场景,数字原生类、文档类、拍照表单类和自然场景类。
数字原生类
淘宝商品图是最具代表的数字原生类字图。图片中的文字是机器生成,后期添加到图片中。该类字图具有最复杂多样、最有价值和图片量最大等特征。在淘宝的商品图里面包含了各种各样的数字原生类图片,其中包含各种字体、背景、排列和组合等。阿里巴巴最近就淘宝商品图举行了一场比赛——MTWI挑战赛,这是目前最大的OCR竞赛。最有价值主要体现在淘宝图上除了有商品的图片以外,还有很多的文字信息,它是商品信息传递的一个载体;这个商品图汇聚了商家美工、制作等很多人的工作。图片数量巨大,淘宝商品的背后大概有千亿图片,而且这些图片非常的有活力,每日不停地更新。读光OCR在淘宝的商品图上做了大量的工作,目前覆盖了所有电商图片的OCR识别。