商业社会对流程自动化的功能的期望将与日俱增,将机器学习等AI技术运用到RPA中,将人工智能功能集成到产品套件中,以提供更多类型的自动化功能,已经成为未来RPA发展的主流趋势。然而,IPA究竟会朝着什么方向发展?IPA又需要哪些核心技术的支持?
在未来,IPA的应用主要会体现如下几大核心技术特点。
1.机器人流程自动化(Robotic Process Automation,RPA)
机器人流程自动化是一种软件自动化工具,用于自动完成具有规则性的、重复性的枯燥流程。它基于事先梳理好的流程和规则编写,并以此执行相应操作,其本身并不具备自我认知能力或学习能力。换句话说就是,RPA是基础,需要与其他技术手段整合在一起,方能实现IPA及其优势。
2.光学字符识别(Optical Character Recognition,OCR)
OCR技术是指利用电子设备(例如扫描仪或数码相机)将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。通俗地说就是,对文本资料进行扫描,然后对图像文件进行分析处理,以获取文字及版面信息的技术。
3.机器学习/大数据分析
机器学习/大数据分析是一种用于设计复杂模型和算法并以此实现预测功能的方法,即计算机有能力去学习,而不是依靠预先编写的代码。它能够基于对现有结构化数据的观察,自行识别结构化数据中的模型,并以此来输出对未来结果的预测。
机器学习是一种通过“监督”和“无监督”学习来识别结构化数据中的模式(例如日常性能数据)的算法。监督算法是指在根据自己的输入做出预测之前,会从输入和输出的结构化数据集来进行学习。无监督算法是指观察结构化数据,并对已识别的模式提供相关见解。机器学习和高级分析可能会改变保险公司的游戏规则,例如,在提高合规性、降低成本结构,以及从新的见解中获得竞争优势。高级分析已经在领先的人力资源部门中得到了广泛应用,主要用于确定和评估领导者和管理者的核心品质,以便更好地预测行为、规划职业发展道路和下一任领导岗位归属。
4.自然语言生成(Natural Language Generation,NLG)
计算机具有与人一样的表达能力和写作能力,它遵循某种规则,将从数据中观察到的信息转换成高质量的自然语言文本。例如,自动识别会议邮件中的主题、数字地名、人名地址并生成行程表备忘录,或者识别出合同条款的关键内容并将摘要的重点生成列表。
5.智能工作流(Smart Workflow)
智能工作流是一种用于流程管理的软件工具,其中集成了由人和机器共同执行的工作,允许用户实时启动和跟踪端到端流程的状态,以便于管理不同组之间的切换,包括机器人与人类用户之间的切换,同时还能提供瓶颈阶段的统计数据。
6.认知智能体(Cognitive Agent)
认知智能体是一种结合了机器学习和自然语言生成的技术,并在此基础上加入情感检测功能以做出判断和分析,使其能够执行任务,交流沟通,从数据集中学习,甚至根据情感检测结果作出决策。换句话说,机器会像人一样产生“情感共鸣、精神共振”,真正成为一个完全虚拟的劳动力(或者智能体)。在客服领域,英国某汽车保险公司通过使用认知智能体技术,将客户转化率提高了22%,验证错误率降低了40%,整体投资回报率达到了330%。
当然,德勤、安永等咨询公司也坦然表示,就现阶段许多企业的流程管理与系统的基础能力来看,仍存在着大量的基础建设工作有待开展。而打造智能流程自动化所需的部分核心技术(例如认知智能体等)也还停留在雏形阶段。
3.2.2 光学字符识别技术
OCR技术一般可分为如图3-1所示的5个阶段。
图3-1 OCR技术的5个阶段
下面具体说明OCR的识别流程。
1.图像处理
针对图像的成像问题进行修正。常见的图像预处理过程包括:几何变换(透视、扭曲、旋转等)、畸变校正、去除模糊、图像增强和光线校正、二值化处理等。
2.文字检测
检测文本所在位置、范围及其布局,通常还包括版面分析和文字行检测等。文字检测解决的主要问题是哪里有文字,文字的范围有多大。