深度解读：Everest 对话式 AI PEAK Matrix 评估报告-来也科技

传统的 RPA 实现的是基于固定规则的流程自动化，在企业实际业务场景中，还有大量不是基于固定规则的业务流程。借助 Al 之后，RPA+Al 机器人则能具备感知和认知能力，将流程自动化与认知自动化结合起来，让企业中更多复杂的、高价值的业务场景实现自动化。

UiBot Mage 提供的三类核心 AI 能力

UiBot Mage 提供三类核心 AI 能力，包括文字识别、文本理解和人机对话。

其中文字识别又包括文档识别、表格识别、票据识别和卡证识别四种子能力。

文档识别指的是对包含中文、英文、数字和常见符号的常见文档进行文字识别，自动检测图片方向，自适应各种文档版面。本能力适用于各种常见的文档识别，如合同、报告、文书等。

表格识别指的是对表格和文字混排的文档进行识别，同时支持一张图片中多个表格识别。本能力适用于各种包含表格的文档识别，如报销单、保险单、申请表等。

票据识别指的是对票据自动分类，并对每类票据识别出不同信息，同时支持一张图片中多张票据同时识别。本能力适用于增值税专用发票、火车票、行程单等常见票据的识别。

卡证识别指的是对卡证自动分类，并对每类卡证识别不同信息，同时支持卡证双面识别，自动判断正面反面。本能力适用于身份证、护照、营业执照等常见卡证的识别。

UiBot Mage 提供的第二类核心 AI 能力为文本理解，包括文本分类、信息抽取和地址结构化等三种子能力。

文本分类指的是按照一定的分类体系或标准对文本进行自动分类标记。来也 UiBot 文本分类能力的优势为：同时支持短文本和长文本的分类、基于小样本即可训练模型、模型自动优化，选择最佳参数。本能力适用于合同分类、邮件分类、工单分类、票就分类等业务场景。

信息抽取指的是从非结构化的文本中抽取结构化信息，用户可以自定义抽取模版，快速实现定制化的信息抽取能力，并支持在一段文本中支持模型和模版的混合模式。本能力的预训练模型可用于 10 余种常见实体的抽取，如企业名称、地址、金额、日期等。

地址结构化能力指的是将非结构化的地址转换为结构化信息，包含省、市、区、街道、详细地址等，过程中支持地址纠错与补全。本能力适用于地址自动录入、地址对比等场景。

UiBot Mage 提供的第三类核心 Al 能力为人机对话能力，包括将语音转换为文本的语音识别、将文本转换为语音的语音合成，和让人通过自然语言与机器人交互的智能对话能力。

自动语音识别(ASR)使用信号处理、深度学习、语言学等技术，将语音信号转换为文本。它属于人工智能中感知智能技术的一种，好比人的耳朵，让 RPA 机器人便具备听的能力。本能力适用于呼叫中心语音机器人、语音质检、语音助手等场景。

语音合成(TTS)技术与语音识别技术相反，将文本转换为语音。它好比人的嘴，让 RPA 机器人具备说的能力。本能力适用于外呼机器人、语音助手等场景。

智能对话能力可以让人通过自然语言与 RPA 机器人进行双向、多轮对话，从而唤醒和调度 RPA 机器人执行流程。这一能力充分应用了来也科技的前沿 Al 技术，包括语义理解、对话管理、机器阅读理解、知识图谱等。来也科技智能对话技术与 RPA 技术相结合的解决方案已在“新冠疫情防控”等多个场景中落地，实现了人机交互驱动的端到端业务流程自动化。