多分类分割任务下的标注问题及解决思路
本文介绍了一种可查找和替换指定类别名的思路与方法。

目前VisionTrain的各类版本中,暂不支持对图像分割的各个类别做样本筛选,只支持OK和NG的搜索方法。


在日常使用中,尤其是多分类分割任务下,可能会遇到以下情况:

1.     多位操作员进行标注,在数据合并后发现有因为拼音错误、手误等原因,导致出现新的类别,但数据量庞大,定位该类别的出现位置十分困难

2.     对于某个类别的标注,需要合并或更改类别名,使类别区分更加合理

3.     多位操作员进行标注,但类别名顺序不同,合并后导致label_color乱序的情况


了解原理:

VisionTrain的图像分割在标注后,会生成原图带有的gt文件(或称作掩膜图)以及对应xml文件:


其中xml是根据gt图生成的点坐标和类别信息,类似htm的格式。可以看到类别对应<flags>class</flags>:


结论:只需要匹配查找到所需要的类别名,再做相应操作(如替换)即可


解决思路:

下面根据python正则匹配方法找到类别青斑:

1. 记录文件路径

    

    上述查找文件的方法比较局限,简单的用点符号定位,各位根据所需可以继续拓展。

2. 匹配对象格式:pattern = re.compile(r'(<flags>)+(青斑)+(</flags>)+')

    
    若需要全部查找或合并,则为pattern = re.compile(r'(<flags>)+.*+(</flags>)+')

3. 根据列表存储的xml绝对路径,打开文件,逐行匹配,找到该类别则输出绝对路径,方便复制路径,以找到该文件。

    

4. 运行结果,复制第二行的文件路径,到训练集中即可找到。

    



同理,也可根据匹配到的字符串,直接修改此类别名。


1. 如下图,修改f.write()方法,objText为需替换的字符,即匹配到的所有字符,changeText则是替换内容。

    

2. 打开visionTrain观察到类别已全部被修改 

    
3.  统一修改的方式同步也解决了label_color乱序的问题

    --->
版权声明:本文为V社区用户原创内容,转载时必须标注文章的来源(V社区),文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:v-club@hikrobotics.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。
上一篇

模型优化方法---通用基础篇

下一篇

一种提升OCR模型识别率的优化方法

评论请先登录 登录
全部评论 0
砖业调参侠
5
创作
5
粉丝
7
获赞
相关阅读
  • 浅谈visionMaster应用感受及优缺点。
    2022-06-13
  • 海康机器人“悉灵杯”课题研究活动-入围公布
    2022-05-31
  • 浅谈visionMaster 通讯的应用(非常好用)
    2022-06-16
  • IDP5104 PDA产品开箱体验和使用分享
    2022-05-30
  • 一篇文章教会你如何计算镜头延长环
    2022-06-08

请升级浏览器版本

您正在使用的浏览器版本过低,请升级最新版本以获得更好的体验。

推荐使用以下浏览器