来也科技CPO褚瑞:传统RPA已成过往,未来RPA会是怎样?
2020 年在疫情的反复波动中画上了句号,中国 RPA 市场也在 2020 年的激烈角逐中逐渐显现出了相对明晰的市场格局,并将逐步迈入 RPA 4.0 时代,而 RPA+AI 的综合技术能力将对各厂商的未来市场地位起到决定性的作用。
RPA 4.0 时代的具体概念及发展在近日甲子光年发布的《2021年中国 RPA 服务行业发展报告》中有明确的梳理,即通过 AI 的加持,让 RPA 由“辅助工具”、“数字化劳动力”转变为“智能连接器”。报告中也反复提到“RPA+AI 厂商成为传统 RPA 产业链的革新者,RPA+AI 厂商具有协同效应,使得 RPA 完成自动化到智能化的升级。其产品中会嵌入自研的 OCR/NLP 等能力,能更好的应对 AI 需求,强势切入原有市场格局。”
对于来也科技来说,我们从 2001 年的“按键精灵”开始,到今天的 UiBot Mage,不只是从“精灵”到“魔法师”的蜕变,更是逐步从帮助个人减少重复性劳动,发展为帮助企业提升工作效能、打通数据孤岛;从让每个人拥有自己的智能小助手,到自研的企业级流程自动化专用 AI 能力平台。
二十年的聚焦与钻研,我们沉淀的不只是自动化的技术,还包括低代码产品的思路、开发者社区运营的经验,生态建设的规划蓝图。更重要的是,我们先后沉淀了两支高度默契的产品研发团队:一支脱胎自“按键精灵”的原班人马,另一支源于百度旗下的智能语音助手团队。2019 年,我们把两支分别代表 RPA 和 AI 的团队双剑合璧之后,就像到达了核反应的临界点一样,一个个创新思路正在裂变式的爆发。
01 数字化转型时代, 小小连接器扮演关键角色
随着云计算、大数据、物联网、人工智能等技术的不断演进,“数字化转型”是当今企业不可不重视的话题,甚至有人说数字化转型代表了第四次工业革命。但是,根据“哈佛商业评论”和 RFP 公司在 2017 年 6 月份发布的调查报告,企业在数字化转型项目时面临诸多障碍,其中前四条障碍分别是:
-
法快速实验(53%)
-
遗留系统(52%)
-
信息/数据孤岛(51%)
-
IT与业务线之间的合作不足(49%)
我们始终在强调,RPA 的本质是一个以低代码为基础的“连接器”。就像一瓶小小的万能胶一样,看起来不起眼,但实际上面对数字化转型的那些障碍,却能够发挥出神奇的作用。
无法快速实验?
RPA 强调的就是短平快的开发,能为业务带来足够的敏捷性。
遗留系统或数据孤岛?
基于 RPA 的“非侵入”特性,通过界面元素的抓取和自动化操作,轻松实现无接口的数据获取和写入。
IT 与业务线之间的合作不足?
RPA 的低代码特性能让 IT 与业务线各司其职,同时取长补短。当 RPA 将多个系统进行快速连接、让数据得以顺畅流转的时候,这个小小的连接器就在数字化转型中扮演了关键的角色。 图片 有的胶可以粘塑料,有的胶专门粘金属,而各种材料通吃的“万能胶”自然更受欢迎。RPA 也是一样,业务系统提供了接口自然不在话下,各种千奇百怪的没有提供接口的系统,也要能广泛识别和操作。能连接的系统越多,这个连接器的价值越大。其实,微软提供了一种称为 UIA 的技术,已经能帮我们轻易识别 80% 业务系统的界面,进而实现连接了。但剩下的 20%,往往就成了体现 RPA 厂商技术实力的“试金石”。比如在虚拟机或远程桌面里的系统界面,由于其本质是一张图像,UIA 技术无能为力。我们早在 2019 年,就采用积累的几十万张界面图片进行深度学习,训练出了智能识别的模型,并放在来也 UiBot 的社区版里,给大家公开试用。我们的模型也还在不断的学习更多的界面,持续改进效果。
02 多潜力发展方向, RPA+AI 智能连接器的大势所趋
同时,随着 RPA 的发展,如今已经到了 RPA+AI 的智能自动化时代,厂商之间是否具有原生的 AI 能力,就会产生质的差异。
在过往几年的探索中,无论是调研还是实践,我们发现:在海外,企业往往是先接受 RPA,然后再考虑如何增加 AI;在中国,AI 似乎比 RPA 更早得到普及。与此同时,AI 在中国市场的蓬勃发展也在一定程度上加快了 RPA 中国市场的繁荣与需求。
AI 的本质是模拟人的认知,把物理世界的信息转移到数字世界中。比如 iPhone 的“刷脸解锁”,就是把物理世界中的人脸,转换为数字世界中的个人身份 ID。RPA 作为连接器,只连接数字世界中的各个业务系统,实现自动化的延展远远不够,如果与 AI 配合,实现物理世界和数字世界的连接,这种 RPA+AI 的系统才能最大化 RPA 部署的价值,我们称之为智能连接器。
AI 连接一:OCR/NLP连接非结构化数据 RPA+OCR/NLP 是 RPA+AI 的基本形态。让智能连接器把物理世界中的发票、身份证等信息连接起来,是扩大其连接范围的常见途径,今天的 OCR 技术背后已经有深度学习的加持,不仅识别率高,也能更好的排除噪音的干扰,配合 RPA 完成“发票自动报税”的场景,成了 RPA+AI 的经典应用。进一步,再用 NLP 技术提取文本中的关键信息,对文本进行分类等,催生了更多有趣的应用场景。比如 RPA 自动收邮件,我们进一步采用基于 NLP 的文本分类技术,实现了邮件的自动分拣,把商机邮件、垃圾邮件和其他邮件区分开,这一方案得到了很多用户的高度认可。
当然,OCR/NLP 技术在各大公有云上都有提供,且还包含了完善的 API 接口,但如果仅通过公有云上的 OCR/NLP 与 RPA 集成,这充其量仅能称为 RPA+API,与强调原生 AI 能力的 RPA+AI 存在天壤之别。以 OCR 为例,客户需要的往往不只是发票识别,还包括了其内部的非标准单据,公有云不可能面面俱到的提供,而我们的 AI 团队只需要重新训练一下现有的模型即可轻松应对,甚至利用迁移学习等技术,训练的成本还可以大大降低。
AI 连接二:Chatbot 连接前台与后端 将 OCR/NLP 进一步延伸,RPA+AI 同时也可以结合 Chatbot,让软件机器人从幕后走到台前,在具备执行后台工作的能力的同时,也具有在前台和用户直接进行交互的能力,打通端到端的节点。
当把 RPA 和 Chatbot 结合起来后,机器人便同时具备了执行任务和与人交互的能力:既有人主动和机器人的交互,比如人通过对话发出指令,然后机器人去执行某个业务流程;也有机器人主动和人的交互,如在执行业务流程的过中,遇到异常或问题时主动寻求人的介入。
在一些复杂的场景下,拥有理解上下文并进行主动询问或澄清能力的对话机器人,则可以实现人机交互中的多轮对话;且其包含文字、语音、文件、图片、视频等的多模态沟通方式,就如同今天我们在工作中通过即时通讯工具或者邮件与同事沟通一样。与 RPA 结合之后,这些机器人就会迅速变成多功能且 24*7 待机的个人助理,比如请机器人帮我搜索某个主题的文献资料,并且自动发送到我的企业微信上,只需拿起手机发一句语音即可,轻松快意。
AI 连接三:Machine Learning/Deep Learning 连接数据与决策 除去上述相对较为成熟的 OCR/NLP 等 AI 能力应用,未来的 RPA 4.0 还将更多聚焦于通过机器学习及深度学习实现的智能决策及流程挖掘,而这也是目前我们正在深耕及发展的主要方向之一。
企业在自动化的逐步探索构建中,往往会面临许多前所未有的问题,例如机器人执行的流程是否足够稳定?长远来看直接开发 API 接口是否更为便捷?自动化之前是否要先将流程标准化?而通过数字员工分析结合机器学习,则能在短期内帮助企业搭建 RPA 脚本;长远来看则有助于设计更先进的人机交互或者人机回环。
通过智能决策,对软件机器人的业务流程操作及产生的数据进行监控,结合业务需求建立分析模型,对数据产生的影响进行量化,并产出关系分析报告向决策者提供有效建议。而与此同时,通过对流程的监控与分析,自动发现业务流程中可以释放的人力及可由软件机器人自动操作的环节,并对其进行评估确定优先级,以实现快速智能自动化的准备。
RPA 4.0 时代已经到来,来也科技三大核心产品,软件机器人流程自动化平台“来也 UiBot”、智能对话机器人平台“吾来” 、专为 RPA 机器人打造的 AI 能力平台“UiBot Mage”,所构成的产品矩阵也已经完成阶段性构建,而其优势正在互相协同支持。
如何更深度的结合 RPA+AI,让其二者共同向更高维度发展?如何持续发挥来也科技开发者与合作伙伴的“双生态”布局?来也科技将继续秉承初心与责任,在内部多产品线、渠道、运营等各维度,直面攻坚和挑战,共同帮助政企实现智能自动化转型,帮助组织与个人加强工作体验,实现效能飞增!
来也科技 CPO 来也科技行业研究院院长 褚瑞
国防科技大学计算机专业博士。前按键精灵、靠谱助手联合创始人兼CTO。 国际数模竞赛特等奖得主;全军十大学习成才标兵;“天河”超级计算机团队成员;曾获得国家科技进步奖;申请专利百余项,发表论文三十余篇。