2021 年 7 月 10 日,世界人工智能创新大赛(下简称:AIWIN)第四届获奖名单正式揭晓。AIWIN 是世界人工智能大会(WAIC)的重要组成部分,本届AIWIN大赛以“AI 助力数字化转型”为主题,关注人工智能在生态治理上的前沿需求和应用挑战。通过不同竞赛模式,面向全球,招募人工智能技术人才与团队,挖掘新的城市治理路径,研发新的城市治理工具,为上海打造人工智能高地提供有力平台支撑。
本届大赛首度开展算法技术赛,并特邀中国工商银行、海通证券、国泰君安、SMT、中国太保出题,提供真实数据。
颁奖现场-AIWIN 盛典
本届 2021 AIWIN 颁奖仪式于 7 月 10 日 WAIC 2021 “产研共育 数智未来”论坛暨 AIWIN 盛典中正式举行,上海市经济和信息化委员会副主任张英登台致辞,“我们在以往的基础上全新打造的云平台2.0,是在疫情防控的要求下,给更多的海内外专家学者参与大会的机会,也进一步拓展了云端的辐射功能。”
随后,剑气长虹的颁奖动画拉开荣誉的画布,来也科技战队从 60+ 世界各地的顶尖选手中脱颖而出,获得“2021 AIWIN 算法技术赛保险文本视觉认知问答竞赛”第一名的光荣战绩。这也是来也科技继 2020 AIWIN “金融赛道 TOP3”、2019 “人工智能创新成果奖”后,在世界人工智能大会重要赛事的梅开三度,为来也科技 2021 百日大战成功打响了第一枪!
同时,在颁奖仪式后的“高端对话:国际视野下的中小企业数字化转型时代新机遇”圆桌论坛中,来也科技董事长兼 CEO 汪冠春与上海人工智能产业投资基金投资总监刘经国等业内大咖共同分享,以机器人流程自动化和 AI 技术实践企业创业者的身份,讲述数字化转型的时代意义。
获奖方案详解
2021 AIWIN 算法技术赛保险文本视觉认知问答竞赛从 Char_Match(字符级准确率)及 Exact_Match(精确匹配准确率)两大维度进行评分衡量,来也科技通过自研的 OCR 技术及文档问答技术,以测评分数“双料第一”的绝对优势,结合现场答辩的优秀表现,荣登榜首!
赛题考官:
中国太平洋保险
赛题背景:
在寿险、产险、健康险等保险的理赔流程和客户服务环节中,存在大量扫描文档,例如医疗票据、费用清单、病例等。对这些扫描文档进行文字检测与识别,并且提取出结构化信息,可以用于极速理赔、个人健康管理等业务场景。
赛题任务:
本次赛题提供扫描文件数据集,参赛队利用 OCR 技术自动识别影像资料后,再通过 AI 智能判断所识别文字的内在逻辑,回答关于图片的自然语言问题。本次大赛提供的数据集使用的扫描文件类型包括票据、说明、报告等 20 多种,混合了印刷、打字和手写的内容。
获奖方案详解:
文本视觉认知问答就是围绕图片文档中的文本内容进行问答的任务。和文档阅读理解相比,图片中的文本包含结构化信息,问答时不能只依赖文字的语义信息。
针对这一任务,来也科技采用了流水线式的整体方案,包含文字识别、文字筛选、阅读理解和模型融合 4 个模块。
文字识别模块可以识别出图片中出现的文字信息,这部分通过来也科技自研的 OCR 技术,其采用最前沿的 OCR 算法,包括多模型的融合和后处理服务,使得识别结果在不同类型的图片上都非常鲁棒。
另外使用 CV 方法识别图片中的矩形联通区域,然后按照联通区域重新排序文字片段,纠正了OCR在多列文档中的错误。文字筛选模块可以提取和问题最相关的文字段落,文字段落和问题拼接后输入到阅读理解模块,得到最后的答案。
在阅读理解模块则使用了来也科技积累的中文语料预训练的 LayoutLM 模型,保持了文字的结构化信息。最后创新性的提出了一种基于文字的模型融合方法,集成了各个阅读理解模型的优势,得到了更加准确的结果。
方案应用:
文本视觉认知问答任务在现实生活非常常见。在面向企业的服务环节中,存在大量包含文本的图片,例如合同、发票、公文、简历等等,针对这些图片进行提问可以快速提取其中包含的结构化信息,给人机协作提供了帮助。
更多荣誉瞬间
2021 中国 AI 商业落地百强企业系列榜单
7 月 9 日,在 2021 WAIC “AI 商业落地论坛”,亿欧 EqualOcean CEO 黄渊普发布了《2021中国AI商业落地市场研究报告》及“2021中国AI商业落地百强企业系列榜单”。来也科技作为企业服务领域 AI 领军者成功上榜。