RPA+AI行业第一款平台型产品终于面世!


2020年5月7日,来也科技成功发布了全新的RPA+AI平台产品UiBot Mage。犹如其中文名“魔法师”一样,来也科技希望通过AI赋能,将OCR(光学字符识别)、NLP(自然语言处理)、人机对话等AI能力快速应用到自动化流程中。


UiBot 是来也科技旗下的RPA机器人流程自动化平台,在UiBot Mage发布之前,由UiBot Creator(创造者)、UiBot Commander(指挥官)、UiBot Worker(劳动者)三部分组成。

UiBot Mage的到来,令来也科技的三驾马车,一跃升级成为四缸引擎。UiBot Mage的发布,意味着来也科技RPA+AI生态真正走向产品落地并且贯穿于RPA机器人流程自动化的方方面面。

图片
UiBot系列产品主图

如果说2019年是RPA的元年,那么今天UiBot Mage的目标则是让RPA机器人更智能。


图片
必然诞生的UiBot Mage

图片RPA(Robotic Process Automation,机器人流程自动化)是一种流程自动化软件工具,能够代替或者协助人类在计算机等数字化设备中完成大量、重复、繁琐的日常业务流程。

图片AI(Artificial Intelligence,人工智能)是由人制造出来的机器所表现出来的智能,指的是通过普通计算机程序来呈现人类智能的技术。


   图片
RPA是双手,AI是大脑

这是一张RPA从业者烂熟于胸的示意图,这张图的经典之处在于,它非常明晰地揭示了RPA和AI之间的关系:

图片RPA模拟人的双手,例如点鼠标、敲键盘,将数据从一个系统录入另一个系统的机械重复工作,解决流程自动化;

图片AI模拟人的大脑,例如语音识别、物体识别、图像识别、OCR等,使用机器学习技术从非结构化对象中提取数据,解决认知自动化。

一种当下流行的观点是,RPA只适用于如下工作场景:高度重复的、跨系统的、规则固定的流程。前两条特性是显而易见的,最大的争议来自“规则固定”这条特性,“规则固定”是RPA的特点之一,但RPA反对者认为,“规则固定”束缚了RPA的更大发展

从客户的角度来看,“规则固定”意味着RPA无法处理需要主观判断的业务流程。也就是说,RPA无法“完整地”处理整个业务流程的自动化,而只能处理部分流程,或者在流程执行的过程中需要人工的介入。

尤其是在人工智能已被科幻电影神化的今天,用户对智能化技术寄予了过多不切实际的期待,用户的高期待与技术的成熟度之间的落差,是许多流程自动化项目难以落地的重要原因。

从市场的角度来看,“规则固定”通常意味着流程的附加值较低,整个RPA项目的价值也随之降低,这也是目前RPA项目客单价普遍较低的重要原因。 
 

图片

流程复杂度与价值关系图

如果将项目按照“复杂度”和“收益”两个维度分为四种,其中,低复杂度高收益的项目,大家都抢着做;高复杂度低收益的项目,大家都不做。

真正拉开各家RPA企业收入差距的,是另外两种项目类型。通常来说,谁家的产品越是能处理各种变化各异的规则,就越能获得高收益。低复杂度低收益、高复杂度高收益,能者多劳,多劳多得,合情合理。

从提升RPA行业价值的角度来看,几乎所有的行业预言家都预测,RPA将会在AI的帮助下,核心能力不断增强,自动化过程不断增加。

未来,我们将看到由机器人流程自动化(RPA),衍生为复杂流程自动化(CPA),最终达到智能自动化(IA)或智能流程自动化(IPA),也就是我们所说的RPA+AI。

因此,作为来也科技“RPA+AI”的重要组成部分,UiBot Mage的推出可谓水到渠成。

图片
UiBot Mage 为RPA提供的三大AI能力

在“Laiye Lead 2020”大会上,来也科技CTO胡一川介绍,UiBot Mage将为RPA机器人提供三类AI能力,即文字识别、文本理解和人机对话,从而为用户带来更大程度的自动化。

图片

UiBot Mage 为RPA提供的三大AI能力


图片我们先从文字识别的AI能力说起。

2018年11月,国际数据组织IDC发布了数据行业的十大预测,其中之一是关于非结构化数据。IDC预测,到2025年,全球产生的数据量将达到175ZB,而超过80%的数据是处理难度较大的非结构化数据

所谓非结构化数据,主要是指那些无法用固定结构来逻辑表达实现,无法被计算机直接处理的数据,从形态上,非结构化数据主要包含这三大块:
第一是文本、文字等;
第二是图像、图片等;
第三是视频、语音等。

图片


结构化数据和非结构化数据


在2018年,这一预测还并未引起RPA行业的关注。不过,随着2019年,中国RPA行业迎来多轮融资,RPA一跃成为ToB市场最为炙热的词,关于IDC的这一预测逐渐成为大家讨论的热门话题。

在RPA行业具有划时代意义的UiBot Mage,正是以文档理解中的非结构化数据为突破点,让企业现有的文档、图形、图像、音频、视频等信息从非结构数据,转变成为结构化数据,尽可能的让企业的各种行为纳入到自动化行列中。

         图片             

UiBot Mage 技术示意图


从UiBot Mage技术示意图中可以看出,UiBot Mage的OCR模块,通过通用文字识别、通用表格识别、票据识别、卡证识别等技术,可以将特定的图片转换成非结构化或者半结构化的文本。

加上通过语音识别、视频识别将视频、语音转换成的文本,几乎所有的非结构化数据,都可以统一转换成文本类数据。

而NLP模块可以实现常见的文本理解和抽取。这里的文本,可以是财务报表、合同、招股说明书、报告等;这里的抽取,指的是将一个句子中的实体都抽取出来。

假设某句话为:“下周一北京到上海的机票是一千两百块钱”,通过UiBot Mage的实体抽取命令,上述句子中的 “下周一”、“上海”、“北京”、“一千两百块钱”等实体都可以被正确抽取。

通过OCR和NLP技术,UiBot Mage可将非结构化数据转化为结构化数据

图片其次,我们再谈论下构建文档理解的解决方案。

所谓文档理解,指的是利用UiBot Mage提供的AI能力,将现实生活中常见的非结构化文档,例如发票、行程单、身份证、合同、邮件等,进行解析和理解,并将该过程集成到完整的业务流程中,助力RPA+AI行业解决方案

图片 

文档理解方案示意图


以合同识别场景为例来说明文档理解方案。为给财务提供成本管理依据,需要将合同扫描成电子文档,并自动识别合同内容,提取出总金额、账期、供应商、合同号等关键信息,最后将合同关键信息录入财务管理系统。

合同识别场景是一个典型的文档理解助力RPA+AI行业解决方案的实例。其中,合同电子化利用扫描仪和高拍仪进行;PDF转换成图片由RPA引擎模块完成;OCR通用文字识别模块完成合同图片到文字的转换;NLP文本信息抽取模块将合同关键信息抽取出来;最后,利用RPA的UI自动化技术将合同信息录入财务管理系统。
           图片             
这样,RPA与OCR、NLP等AI能力配合,共同完成无AI能力的RPA产品无法做到的场景。流程搭建时间只需要1天,处理效率可达人工的20倍以上。

图片最后,我们看看UiBot Mage提供的人机对话能力

人机对话能力到底有多重要?随着企业中RPA机器人数量的增加,UiBot Mage提供的人机对话能力支持双向交互、多轮对话以及多种模态,为人与RPA机器人的交互提供了无限的可能。

具体而言,一种是人主动向机器人发出指令,以完成某个业务流程;另一种是机器人在执行某个业务流程中,遇到需要人去干预的问题,可以主动和人交互。特别在一些复杂场景下,需要多轮对话才能完成交互的流程,人机对话的能力就显得尤为重要。

图片

走向未来:超级自动化


Forrester曾针对企业做过一项调研,2019年末,RPA技术在所有企业自动化系统部署中排名最低;而到2020年,RPA技术的排名则上升到了第一位。


Forrester分析师卢冠男在“Laiye Lead 2020”大会上也表示,市场对于RPA的预期越来越高,不具备 AI 能力的RPA 工具将会被替代。其中,RPA充当了肌肉的角色,AI提供了认知和判断力,两项能力结合组成的智能自动化,才是整个企业实现自动化流程的关键。

无独有偶,另外一家信息技术研究和顾问公司Gartner,曾对2020年十大战略性技术趋势做出了预测,其中以RPA机器人流程自动化为代表的“超自动化”作为企业数字转型的重要工具,受到各行业的一致好评夺得榜首

所谓超级自动化,是指运用包括AI和机器学习在内的先进技术,以便日益使流程实现自动化,并增强人类。超级自动化不仅涵盖可以实现自动化的一系列工具,还涉及自动化的精密复杂性(即发现、分析、设计、自动化、测量、监控和重新评估)。

从这个角度看:超级自动化 ≈ RPA + AI

由于没有任何一种工具可以代替人类,如今超级自动化涉及多种工具,包括机器人流程自动化(RPA)、智能业务管理软件(iBPMS)和AI,旨在日益借助AI来制定决策。

来也科技一直坚持RPA+AI,在超级自动化的道路上从未停歇脚步:从依托第三方到自研AI技术,从NLP到OCR,从对话机器人到UiBot Mage,从单个AI技术到搭建人工智能平台,一步一个脚印,坚定而执着。

从诞生,到走向市场,UiBot Mage迈过了关键性的一步。现在,不妨让我们一起感受UiBot Mage带来的神奇变化。