核心:规模化的真正瓶颈不在处理能力,单份文档的处理各家差别不大,而在"能不能低成本地让第101种单据和第1种一样快上线"
差异:传统IDP每增加一种单据需数周标注训练,ADP用自然语言描述即刻生效,零标注是关键分水岭
验证:跨国企业全球发票处理案例,单张处理时间降93%、审批周期从15天缩至3天、自动化率从零到75%
规模化的真正挑战
IDC预测2025-2029年全球数据量将从213.56ZB增至527.47ZB
非结构化数据占比86.8%
年增长速度55%-65%
- 中型企业今天面对100种单据类型,三年后将面对400种
三层架构:从文档理解到规模化治理
多模态识别覆盖图片、PDF、扫描件和手写票据
自然语言指令即刻生效无需训练
吞吐量:解析约7000页/小时,结构化抽取约2000页/小时
- 零标注特性:用自然语言描述提取需求,系统即刻生效
跨系统操作不仅仅依赖各目标系统是否开放API
调用APA技能模拟人工操作直接驱动金蝶、SAP、各类ERP和审批系统
- 调用ADP技能形成"文档理解→业务操作"的无缝衔接
当100个部门的500个Agent同时运行时,核心变成权限归属、成本归因和异常处理
RBAC角色权限限制每个部门可调用的技能范围
Token消耗按部门归因分析
- 全量审计日志让每一笔文档处理操作可追溯
来也ADP零标注,规模化初始化的关键差异
采集样本→人工标注→训练模型→测试验证→部署上线
这个循环通常需要数周
- 1000种单据就是1000个这样的循环,不可规模化
产品经理或业务人员用自然语言描述"我要提取采购订单中的物料编码、数量、单价和到货日期"
系统即刻生效,没有标注环节,没有训练等待周期
- "1000种单据"从一个组织管理噩梦变成了一个可操作的规模化目标
第一阶段:辅助工具运行,提取结果由人工审核,团队熟悉系统、建立信任
第二阶段:智能协作模式,高置信度单据自动通过、中低置信度标记疑点交人复核
- 第三阶段:高度自动化,超过90%的单据无需人工干预,人机协同数据飞轮让系统持续自我优化
成本对比:规模化的隐形天花板
维度 | 传统方案 | Laiye Worker |
|---|---|---|
入门门槛 | 需采购训练,按单据类型计费 | 免费社区版,注册即获100积分 |
初始化周期 | 每类单据数周(标注+训练) | 自然语言描述即刻生效 |
新增单据成本 | 每增加一类需重新标注 | 零边际成本 |
持续优化 | 需重新训练 | 人机协同数据飞轮自动提升 |
治理能力 | 取决于平台 | Shifu统一管控 |
单张发票处理时间从45分钟压缩到3分钟(降幅93%)
三单匹配准确率从85%提升至96%
端到端审批周期从15天缩短到3天
- 整体自动化率从零提升到75%
规模化部署的决策建议
单据批量处理常见问题(FAQ)
Q: 1000种单据的初始化要多久?
传统IDP:每类单据需标注训练,以周为单位,1000种就是1000周起步
来也ADP:用自然语言描述需求即刻生效,理论从描述到出结果只需几分钟
- 真正的耗时在业务验证和规则微调上,而非技术等待周期
Q: 大模型批量处理单据的Token成本会不会失控?
模型智能路由按任务复杂度自动选择模型,简单单据用轻量模型降本
人机协同数据飞轮让自动通过率持续提升,需人工介入的单据比例递减
- 整体运营成本随时间下降而非上升
Q: ADP和传统IDP的初始化流程具体有什么不同?
传统IDP:采集样本→标注字段位置→训练抽取模型→测试→上线(循环每类单据,数周)
ADP:用自然语言描述提取目标→输入样例文档验证→调整指令→正式上线(分钟到小时)
省去了标注和训练两个最耗时的环节
- 上线后每一次人工修正都会自动优化系统,不需要重新走训练流程
Q: 100种以上的单据类型,会不会让Agent的响应变慢?
ADP的提取逻辑是按任务描述动态执行,不是"每种单据一个模型"
100种单据和10种单据的推理速度基本一致
- 真正影响响应速度的是单份文档的复杂度和页数,而非系统注册的单据种类数量
Q: 已有人工审核团队,ADP怎么和他们协作?
第一阶段:ADP做初筛,人工审核所有结果,团队建立对系统的信任
第二阶段:高置信度自动通过,中低置信度才交人工复核,人力聚焦在疑点上
- 第三阶段:90%以上自动化,人工从"操作者"变为"监督者"
Q: Shifu治理面板能按部门分别控制Agent的操作范围吗?
RBAC角色权限按部门精细化分配
财务部只能调用发票和报表相关技能,采购部只能操作订单和供应商管理
每个部门的Token消耗独立归因分析,成本按部门分摊清晰透明