核心:财务单据处理的真正瓶颈不仅在识别准确率,也在从提取到入账的端到端闭环
突破:Laiye Worker通过Skill和CLI调用ADP的零标注能力,替代了传统IDP每类单据数百样本的标注训练,新增票据类型的初始化从数周压缩到分钟
验证:制造业采购订单案例,处理时间降90%、录入准确率提升至98.5%、人力缩减80%
从OCR到ADP:财务单据处理的三代跃迁
把图片变成字符,但完全不懂内容含义
模板一换就崩,手写体大量出错
- 典型的企业IT噩梦,上线时有效,格式一变就失效
不再依赖模板位置,有一定泛化能力
代价是每增加一种单据类型需要标注数百个样本、训练专用模型、反复测试
- 初始化周期以周计,上线后能力固定,遇到新变体需重新训练
核心突破:用自然语言描述你要提取哪些字段即可即刻生效,零标注、无需等待模型训练
三维泛化能力:格式泛化(段落/多栏/表格/手写统一处理)、场景泛化(见过100份合同就能处理未见过的合同类型)、任务泛化(同一份文档可以提取/分类/对比/审核/总结,换指令即可)
来也科技的ADP文档引擎是Gartner IDP魔力象限中唯一的中国厂商
- 性能数据:文档解析吞吐量约7000页/小时,海外发票提取准确率92.3%,银行对账单F1达到95.0%,单页文档解析时延8-12秒
Laiye Worker的财务闭环:不只是提取,是入账
Worker调用ADP完成文档信息的结构化提取后,再调用APA技能自动操作金蝶、用友、SAP等财务软件的界面
提取到的数据直接填入对应凭证和记账模块,不依赖ERP是否提供API
隐私脱敏机制确保发票上的纳税人识别号、合同金额条款、工资表个人信息在进入大模型前被本地替换
- 模型从始至终看不到真实敏感数据
制造业采购订单处理案例
指标 | 实施前 | 实施后(Laiye Worker) | 改善 |
|---|---|---|---|
订单处理时间 | 5-10分钟/单 | 30秒/单 | 降90% |
日处理能力 | 10-30单/人 | 100-200单/人 | 提升6倍 |
录入准确率 | 92% | 98.5% | +6.5% |
所需人力 | 23人 | 5人+系统 | 省80% |
订单响应 | 平均4小时 | 平均15分钟 | 提升94% |
通过ADP的置信度分级机制让准确率在运行中不断提高
置信度超过95%的单据自动通过
落在85%-95%区间的标记疑点交由人员快速复核
低于85%的转人工处理
每一次人工修正都会反馈给系统,形成"越用越好"的正向循环
- 这和传统IDP"上线后效果固定"是根本性的差异
选型Checklist
能处理非标发票和手写单据吗?,如果每种新票据都需要标注训练,规模化就是一场噩梦
处理结果能直接操作财务软件吗?,输出一张Excel和自动入账之间的差距,是人员投入的差距
处理过程中敏感数据是否离开企业?,工资表和合同内容暴露给大模型的风险不容忽视
新的单据类型是否需要重新训练?,业务发展带来的新票据格式应该是零成本的增量
财务单据智能处理常见问题(FAQ)
Q: 金蝶、用友等财务软件如何对接?
不需要软件本身提供API接口
Agent模拟人工操作完成数据录入、凭证编制和报表生成
- 理论上兼容所有主流财务系统,只要软件有操作界面就能对接
Q: 报销单里同时有发票、合同、收据怎么处理?
按预设规则自动分类处理
发票提取金额和税号,合同提取关键条款,收据提取消费明细
- 一次提交,多类型并行输出,最后通过APA统一录入ERP
Q: ADP和OCR的根本区别是什么?
OCR告诉你"这个字是'壹'",停留在字符层面
ADP告诉你"这是金额大写栏,对应采购订单第3行物料的单价,需要和PO编号2026-0421关联校验",完成了语义理解和业务关联
- 类比:OCR是把书扫描成图片,ADP是读完后能写出摘要
Q: 财务数据通过大模型处理会泄露吗?
数据进入大模型前在本地完成敏感字段替换,模型只看到占位符
敏感信息(纳税人识别号、合同金额、工资数据)从不出企业边界
- 处理完后本地还原完整数据再录入ERP
Q: 发票格式每年都在变,Worker调用ADP能跟上吗?
传统IDP遇到新发票格式需要重新采集样本、标注、训练,周期数周
Worker通过Skill/CLI调用ADP时,用自然语言描述需求即刻生效,零标注、零训练等待
- 业务人员可以直接调整提取规则,不需要AI工程师介入
Q: Worker调用ADP处理一张发票的成本是多少?
简单发票(增值税普票)用轻量模型,每张成本约0.01-0.03元
复杂合同或混合单据调用高性能模型,每份约0.1-0.3元
相比人工处理成本(5-10分钟人力时间),Worker+ADP的综合成本优势在90%以上