labelimg、labelme安装使用、对比和区别以及关于标注数据质量问题

最新推荐文章于 2025-03-24 15:17:20 发布

RayChiu_Labloy

最新推荐文章于 2025-03-24 15:17:20 发布

阅读量2.7k

点赞数 4

分类专栏： # 目标检测文章标签：计算机视觉 opencv 目标检测人工智能深度学习

本文链接：https://blog.csdn.net/RayChiu757374816/article/details/119326892

版权

目标检测专栏收录该内容

18 篇文章

订阅专栏

作者：RayChiu_Labloy
版权声明：著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处

labelme安装这里就不多说了，方式差不多，建议 pip install方式

然后重点是两者的对比和区别：

关于图片素材标注质量：

labelimg安装：

方式一：

安装：

pip install labelimg

打开：

labelimg

方式二：

从github 下载zip包地址：https://github.com/tzutalin/labelImg

安装三方依赖库：

conda install pyqt=5
pip install lxml -i https://pypi.tuna.tsinghua.edu.cn/simple/

解压labelimg进入其根目录，检查发现没有resources.py 但是有resources.qrc，将原来的resources.qrc文件转换成resources.py文件：

Pyrcc5 -o resources.py resources.qrc

将我们刚刚的labelImg-master文件夹里面的resources.py文件移动到libs里面：

在这里插入图片描述

在labelimg根目录执行命令打开工具：

python labelimg.py

labelimg快捷键

labelme安装这里就不多说了，方式差不多，建议 pip install方式

然后重点是两者的对比和区别：

先上图：

表格整理对比：

参考： Labelme和LabelImg使用（Win10）_Along1617188的博客-CSDN博客：

labelimg标注某张图片生成的xml文件：

<?xml version='1.0' encoding='utf-8'?>
<annotation>
	<folder>JPEGImages</folder>
	<filename>1.bmp</filename>
	<path>E:\projects\pyHome\about_yolo\yolov5_bottleCap_defect_detection\VOCData\JPEGImages\1.bmp</path>
	<source>
		<database>Unknown</database>
	</source>
	<size>
		<width>1280</width>
		<height>960</height>
		<depth>3</depth>
	</size>
	<segmented>0</segmented>
	<object>
		<name>defect</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>1</difficult>
		<bndbox>
			<xmin>589</xmin>
			<ymin>411</ymin>
			<xmax>701</xmax>
			<ymax>480</ymax>
		</bndbox>
	</object>
</annotation>

labelme标注一张图片生成的json文件：

{
  "version": "4.5.9",
  "flags": {},
  "shapes": [
    {
      "label": "normal",
      "points": [
        [
          584.6122448979592,
          412.3061224489796
        ],
        [
          708.0816326530612,
          484.7551020408163
        ]
      ],
      "group_id": null,
      "shape_type": "rectangle",
      "flags": {}
    }
  ],
  "imagePath": "1.bmp",
  "imageData": "iVBORw0KGgoAAA ...(省略一万字符) CYII=",
  "imageHeight": 960,
  "imageWidth": 1280
}

关于图片素材标注质量：

数据、算力、算法齐驱人工智能的三大马车我认为数据更重要，数据是人工智能的核心竞争力。算法再厉害，没有数据，也是巧妇难为无米之炊。每个家企业的算法虽有区别，但是算法通过数据不断投喂，可以不断学习进化，会越来越聪明，从而呈现出马太效应，强者恒强的效应。模型训练人员利用标注好的数据训练出模型算法，但人工标注的数据，往往甚至不可避免的会存在一些错标的数据，尤其是在对标注准则或者流程不完善时，错标就更常见了，所以有个岗位叫数据审核师