根据实际需求找到最优方案-OCR识别篇
在各类常见行业应用及智能相机的市场定位中,OCR识别的需求一直是最多最丰富的需求也是大家最关注的方向,本文以智能相机为产品依托,结合实际需求介绍各场景下的OCR识别类型及方法

首先关注一个核心问题:什么场景下的OCR识别需求分别对应选择什么型号智能相机,以及是否需要深度学习?


一、字符识别 

     对于一些产线产品位置固定,OCR 特征清晰明显,对比度高、背景简单的字符,可 以通过传统方式即阈值分割的形式进行读取的需求,相机字符识别自带的模型可以应对 现场如点阵、刻蚀、压印出来的字符。自带的模型内部已经训练了几百万张样本,基本涵盖了绝大部分应用场景。




二、特征匹配(位置修正)+字符识别 

      对于一些产品在视野内可能位置会变动、产品位置不固定但前景和背景灰度差较大、干扰较少的实际场景,可以开启位置修正对字符识别进行辅助定位,来保证产品移动、旋转等各种情况下都可以定位到要识别的字符。 

注:开启位置修正后,需保证模板区域始终在相机视野内,否则特征匹配不到会持续NG。详见SCMVS客户端用户手册-基准图设置



三、DL 字符识别 

     在一些字符形态大小不统一,对比度低,背景存在干扰,字符粘连,畸变等场景, 传统方法效果一般,这个时候可以用到深度学习,在常见行业如,食药品包装,电子行业,烟草行业薄膜,半导体晶源等等已经实现全行业覆盖,不需要进行过多的模型训练,就可以实现字符的高效识别检测,准确率基本在三个九以上。



四、DL字符定位+DL字符识别
      在很多实际的OCR检测需求中,字符位置不固定,字符大小不统一,甚至一些需求仅检测视野内某个特定区域内的字符,应对这类情况,往往需要深度学习定位和深度学习识别搭配起来使用,提高准确率和稳定性达到预期效果。

食品行业喷墨会导致字符大小、深浅、形态和位置都会有变化,传统方法无法准确定位到字符,引入深度学习定位和深度学习识别有效解决难题。

面对仅检测红框内字符(出界即NG)的实际需求,传统算法模块无法实现检测需求,引入深度学习定位进行辅助,定位框框选目标区域,搭配出界过滤使能完美解决应用难点。

外包装行业需要对箱体喷墨进行OCR识别,字符位数、长短、大小、位置及拍照距离都存在变化,且应对字符分段、喷墨深浅不一、存在划痕等干扰,深度学习都可以稳定定位并识别。


      OCR识别仍然是智能相机的主要应用方向之一,关于OCR识别的优化和更新也是智能相机的重点迭代方向,智能相机会结合市场需求和建议不断优化算法库以适应并解决愈发多样性的检测场景和任务,有关智能相机OCR识别的案例集可联系总部售前获取。

版权声明:本文为V社区用户原创内容,转载时必须标注文章的来源(V社区),文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:v-club@hikrobotics.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。
上一篇

SC系列传感器常见问题答疑

下一篇

V社区一周年“心仪祝福”揭晓

评论请先登录 登录
全部评论 0
Lv.0
2
创作
2
粉丝
6
获赞
相关阅读
  • 3C行业|字符缺陷检测及字符识别
    2022-11-11
  • VM常见定位场景与方案设计
    2022-11-11
  • VM模块-相机映射
    2022-11-11
  • AI训练平台V2.1上线公测啦
    2022-11-05
  • V社区一周年“心仪祝福”揭晓
    2022-11-08

请升级浏览器版本

您正在使用的浏览器版本过低,请升级最新版本以获得更好的体验。

推荐使用以下浏览器