V社区-机器智能技术交流-根据实际需求找到最优方案-OCR识别篇

首先关注一个核心问题：什么场景下的OCR识别需求分别对应选择什么型号智能相机，以及是否需要深度学习？

一、字符识别

对于一些产线产品位置固定，OCR 特征清晰明显，对比度高、背景简单的字符，可以通过传统方式即阈值分割的形式进行读取的需求，相机字符识别自带的模型可以应对现场如点阵、刻蚀、压印出来的字符。自带的模型内部已经训练了几百万张样本，基本涵盖了绝大部分应用场景。

二、特征匹配（位置修正）+字符识别

对于一些产品在视野内可能位置会变动、产品位置不固定但前景和背景灰度差较大、干扰较少的实际场景，可以开启位置修正对字符识别进行辅助定位，来保证产品移动、旋转等各种情况下都可以定位到要识别的字符。

注：开启位置修正后，需保证模板区域始终在相机视野内，否则特征匹配不到会持续NG。详见SCMVS客户端用户手册-基准图设置

三、DL 字符识别

在一些字符形态大小不统一，对比度低，背景存在干扰，字符粘连，畸变等场景，传统方法效果一般，这个时候可以用到深度学习，在常见行业如，食药品包装，电子行业，烟草行业薄膜，半导体晶源等等已经实现全行业覆盖，不需要进行过多的模型训练，就可以实现字符的高效识别检测，准确率基本在三个九以上。

四、DL字符定位+DL字符识别
在很多实际的OCR检测需求中，字符位置不固定，字符大小不统一，甚至一些需求仅检测视野内某个特定区域内的字符，应对这类情况，往往需要深度学习定位和深度学习识别搭配起来使用，提高准确率和稳定性达到预期效果。

食品行业喷墨会导致字符大小、深浅、形态和位置都会有变化，传统方法无法准确定位到字符，引入深度学习定位和深度学习识别有效解决难题。

面对仅检测红框内字符（出界即NG）的实际需求，传统算法模块无法实现检测需求，引入深度学习定位进行辅助，定位框框选目标区域，搭配出界过滤使能完美解决应用难点。

外包装行业需要对箱体喷墨进行OCR识别，字符位数、长短、大小、位置及拍照距离都存在变化，且应对字符分段、喷墨深浅不一、存在划痕等干扰，深度学习都可以稳定定位并识别。

OCR识别仍然是智能相机的主要应用方向之一，关于OCR识别的优化和更新也是智能相机的重点迭代方向，智能相机会结合市场需求和建议不断优化算法库以适应并解决愈发多样性的检测场景和任务，有关智能相机OCR识别的案例集可联系总部售前获取。

28篇

什么是深度学习？

深度学习的前沿研究与应用

深度学习和传统算法在缺陷检测应用中的特点

深度学习训练工具VisionTrain1.4.1功能更新说明

模型优化方法---通用基础篇

模型优化方法---VM算法平台预测篇

模型优化方法---VisionTrain训练篇

模型优化方法---预测耗时篇

深度学习小工具之快速图像分割

深度学习小工具之标签转化工具

深度学习小工具之图像名称、标签文件内容修改工具

训练误差与泛化误差的关系

训练过程中对于误差值的理解

基本图像增强算法对深度学习模型结果的影响

使用VM深度学习功能实现模型训练与图像检索功能

智能相机-深度学习OCR训练及优化指南

一种提升OCR模型识别率的优化方法

根据实际需求找到最优方案-OCR识别篇

多分类分割任务下实现指定类别的阈值调整

多分类分割任务下的标注问题及解决思路

图像分割标注训练经验分享

基于VM界面层的多类别缺陷统计方案

VM深度学习OCR项目经验分享

【VM集成开源AI】深度学习算子模块封装

深度学习推理耗时波动现象的解决方法

【共享学习】关于深度学习显卡推理那些事儿

VM7100深度学习检测温度传感器焊点，裸针，锡珠，超盘，

深度学习缺陷检测项目经验分享