眼下人工智能正在越来越被人们接受,人工智能也在解决着让诸多行业一直头疼的问题,如何节约人工成本的问题。以医疗行业为例,堆积的大量的医疗单据如何快速处理就是一个很头疼的问题。
随着互联网的不断发展,医疗行业与互联网的结合越发紧密,政策的不断开放,涌现出许多医疗相关的互联网公司。而在医疗互联网行业,数据的传输是实现网上交流的基础。在医疗行业的数据主要是医疗单据,然而,大部分医院的医疗单据往往不提供电子版数据,这为医疗互联网数据交流带来了很大的困难。
以门诊票据这一最常见的医疗单据之一为例,探索化验单图文识别的算法。常见的通用光学字符识别工具常要求水平、噪音较少的文本,而化验单图片拍摄条件往往较差,通用光学字符识别工具在化验单上的表现糟糕,无法使用。根据化验单图片数据的特点将化验单图文识别任务拆分成三个主要步骤:表格区域检测、文字检测、文字识别,并通过三个基于深度学习的模型实现。
以此同时,对很多保险机构而言,由于医疗票据样式多、资料复杂、数量较大,往往需要依靠人力进行分拣、审核及录入,既导致理赔流程耗时长,用户服务体验不好;又造成人力投入巨大,机构运营成本高昂。
基于以上业务痛点,作为保险业务智能化的先行者,深圳市悦保科技有限公司投入大量人力物力在医疗票据识别技术的研发上,目前已初见成效。悦保科技基于自研的OCR识别、自然语言理解、知识图谱等技术,实现对各类医疗票据信息的结构化识别提取&#x