OCR识别的技术流程-来也科技

OCR识别的技术流程

来也科技智能自动化平台-助力政企实现智能时代的人机协同机器人BOT2022-08-26

OCR识别预处理：包括灰度化（如果是彩色图像）、降噪、二值化、字符切分、归一化这些子步骤。

OCR识别

经过二值化后，图像只剩下两种颜色，即黑和白，其中一个是图像背景，另一个颜色就是要识别的文字了；降噪在这个阶段非常重要，降噪算法的好坏对特征提取的影响很大。字符切分则是将图像中的文字分割成单个文字——识别的时候是一个字一个字识别的。如果文字行有倾斜的话往往还要进行倾斜校正。归一化则是将单个的文字图像规整到同样的尺寸，在同一个规格下，才能应用统一的算法。

特征提取和降维：特征是用来识别文字的关键信息，每个不同的文字都能通过特征来和其他文字进行区分。对于数字和英文字母来说，这个特征提取是比较容易的，因为数字只有10个，英文字母只有52个，都是小字符集。对于汉字来说，特征提取比较困难，因为首先汉字是大字符集，国标中光是最常用的第一级汉字就有3755个；第二个汉字结构复杂，形近字多。

在OCR识别过程中，确定了使用何种特征后，视情况而定，还有可能要进行特征降维，这种情况就是如果特征的维数太高（特征一般用一个向量表示，维数即该向量的分量数），分类器的效率会受到很大的影响，为了提高识别速率，往往就要进行降维，这个过程也很重要，既要降低维数，又得使得减少维数后的特征向量还保留了足够的信息量，以区分不同的文字。

热门标签

热门文章

来也科技智能自动化平台-助力政企实现智能时代的人机协同

来也ADP白皮书重磅发布！深度解读智能体文档处理新范式

2025-11-04

来也科技智能自动化平台-助力政企实现智能时代的人机协同

来也科技发布智能体文档处理平台，助力政企迈入数据资产时代

2025-09-25

来也科技智能自动化平台-助力政企实现智能时代的人机协同

来也科技即将亮相2025云栖大会，邀您共赴这场科技盛会

2025-09-17

来也科技智能自动化平台-助力政企实现智能时代的人机协同

中国唯一｜来也科技入选首个Gartner®智能文档处理(IDP)魔力象限报告

2025-09-11

上一页

来也ADP白皮书重磅发布！深度解读智能体文档处理新范式

来也ADP白皮书重磅发布！深度解读智能体文档处理新范式

来也科技正式发布《来也ADP：文档处理进入智能体时代》白皮书，全面解读来也科技智能体文档处理平台的核心能力、技术架构、最佳实践和应用案例，为制造、保险和银行等行业提供了从“识别”到“理解”的文档处理升级路径，助力企业打破传统解决方案的局限，迈入智能体时代。

来也科技发布智能体文档处理平台，助力政企迈入数据资产时代

来也科技发布智能体文档处理平台，助力政企迈入数据资产时代

9月20日，来也科技于2025华为全联接大会——华为云全球伙伴活动上推出业界领先的智能体文档处理平台（Laiye Agentic Document Processing，简称Laiye ADP）。智能体文档处理平台基于视觉语言模型（VLM）和大语言模型（LLM），利用智能体等前沿技术，帮助企业高效、精准地处理多语言、多版式的非结构化文档，显著提升业务处理效率与数据决策能力；它像一位“读懂业务”的智能专家，无需事先“教学”，即可完成自然语言提出的文档处理需求。

来也ADP白皮书重磅发布！深度解读智能体文档处理新范式

来也ADP白皮书重磅发布！深度解读智能体文档处理新范式

来也科技正式发布《来也ADP：文档处理进入智能体时代》白皮书，全面解读来也科技智能体文档处理平台的核心能力、技术架构、最佳实践和应用案例，为制造、保险和银行等行业提供了从“识别”到“理解”的文档处理升级路径，助力企业打破传统解决方案的局限，迈入智能体时代。

来也科技发布智能体文档处理平台，助力政企迈入数据资产时代

来也科技发布智能体文档处理平台，助力政企迈入数据资产时代

9月20日，来也科技于2025华为全联接大会——华为云全球伙伴活动上推出业界领先的智能体文档处理平台（Laiye Agentic Document Processing，简称Laiye ADP）。智能体文档处理平台基于视觉语言模型（VLM）和大语言模型（LLM），利用智能体等前沿技术，帮助企业高效、精准地处理多语言、多版式的非结构化文档，显著提升业务处理效率与数据决策能力；它像一位“读懂业务”的智能专家，无需事先“教学”，即可完成自然语言提出的文档处理需求。

下一页

500强企业都选择的数字员工解决方案

变革工作方式，简化运营流程，优化人力资源，提升客户体验