windows安装labelme打标签并生成二值（黑白）标签图（也是一种特殊的灰度图）

五阿哥爱跳舞

已于 2023-06-25 11:45:53 修改

阅读量4.2k

点赞数 9

分类专栏：操作系统 CV图像分割文章标签： python 开发语言

于 2022-05-28 11:36:24 首次发布

本文链接：https://blog.csdn.net/adreammaker/article/details/125016346

版权

操作系统同时被 2 个专栏收录

38 篇文章 3 订阅

订阅专栏

CV图像分割

13 篇文章 1 订阅

订阅专栏

安装labelme

1创建conda子环境

例如：conda create -n 子环境名 python=版本

conda create -n labelme python=3.7

输入y回车

2激活conda子环境

conda activate labelme

3安装labelme的依赖包

conda install pyqt
conda install pillow

4安装labelme工具包

pip install labelme

安装的错误

如果出现如下报错
WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection broken by 'ConnectTimeoutError(<pip._vendor.urllib3.connection.HTTPSConnection object at 0x000002AA50DBB388>, 'Connection to pypi.org timed out. (connect timeout=15)')': /simple/labelme/ ERROR: Operation cancelled by user
使用下面这句话安装labelme（换安装源）

pip install labelme -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com

用labelme打标签生成json文件

打开labelme

labelme

1、点击open dir选择包含所有图像的文件夹

在这里插入图片描述

2、一次按图片顺序对孔打标签

在这里插入图片描述

3、点击保存后，保存json文件

在这里插入图片描述

4、点击next image打下一张

所有图片打完标签之后，所有图片的json也就保存完了

根据json生成图像

激活labelme环境之后，
将cmd命令位置进入到生成的json所在文件夹内
然后输入下面命令生成标签图片

labelme_json_to_dataset 1.json -o label_json/1

在这里插入图片描述

得到的标签图如下：

注意，该命令也可以通过python批量生成：

import os
json_PATH = "D:\codespace\labelme\\data3\\Y101H2_7B\\16"
jsos_path_list = os.listdir(json_PATH)
jsos_path_list
for i, file_path in enumerate(jsos_path_list):
    if 'json' in file_path:
        path = 'labelme_json_to_dataset '+file_path+' -o label/'+str(i+1)
        print(path)

将下面批量生成的命令行直接复制到json所在文件夹下即可自动生成标签文件夹，注意要提前新建一个label文件夹，该命令无法自动创建文件夹，下面的命令行有时候需要执行两次，我猜测是因为2、4、6这些下一级的文件夹也需要一个创建的过程，第一次执行创建完成后，第二次执行才会保存。

labelme_json_to_dataset 10_20.json -o label/2
labelme_json_to_dataset 10_4.json -o label/4
labelme_json_to_dataset 15_25.json -o label/6
labelme_json_to_dataset 16_8.json -o label/8
labelme_json_to_dataset 17_32.json -o label/10
labelme_json_to_dataset 17_34.json -o label/12
labelme_json_to_dataset 18_13.json -o label/14
labelme_json_to_dataset 19_14.json -o label/16
labelme_json_to_dataset 19_29.json -o label/18
labelme_json_to_dataset 19_31.json -o label/20
labelme_json_to_dataset 25_8.json -o label/22
labelme_json_to_dataset 26_20.json -o label/24
labelme_json_to_dataset 28_6.json -o label/26
labelme_json_to_dataset 29_26.json -o label/28
labelme_json_to_dataset 3_36.json -o label/30
labelme_json_to_dataset 4_14.json -o label/32
labelme_json_to_dataset 4_25.json -o label/34
labelme_json_to_dataset 4_36.json -o label/36
labelme_json_to_dataset 7_19.json -o label/38
labelme_json_to_dataset 9_22.json -o label/40

常用的图像处理库 opencv(cv2)和PIL.Image
一、PIL.Image.open
H×W×C，RGB，数据类型 PIL.JpegImagePlugin.JpegImageFile
通过 numpy.asarray(image_pil) 可转成 numpy.ndarray
二、cv2.imread
H×W×C，BGR，数据类型 numpy.ndarray
通过 cv2.cvtColor(image_cv2, cv2.COLOR_BGR2RGB) 可转成 RGB

注：以上两种库读取到的图片值不一定完全一样（就算都转成 RGB 的 ndarray 之后也），某些像素的值有可能会相差1。

将标签图像转换为二值图像（基于CV2和阈值)和图像移动操作

我实际代码操作中的图像转换，使用的是基于cv2和阈值的方法。

不转也可以，具体变1的过程，可以在代码的数据读取部分中修改

补充：
# img = cv2.imread('ImproveUnet195seg.png',cv2.IMREAD_GRAYSCALE)
cv2.IMREAD_COLOR：加载彩色图片，这个是默认参数，可以直接写1。  
cv2.IMREAD_GRAYSCALE：以灰度模式加载图片，可以直接写0。  
cv2.IMREAD_UNCHANGED：包括alpha(包括透明度通道)，可以直接写-1  
GRAY是灰度图，转换规则为： Gray = 0.299R + 0.587G + 0.114B  # 单通道

具体使用代码如下

import os
import shutil
import cv2

label_from_PATH = "D:\codespace\labelme\original\label_json"
label_to_PATH = "D:\codespace\labelme\original\label"

filepath_list = os.listdir(label_from_PATH)
# filepath_list.remove("labelme_json_to_dataset.exe")

# 检查是否存在label文件夹
if not os.path.isdir(label_to_PATH):
    os.mkdir(label_to_PATH)

# 是否图像二值化
# 如果True则，对图像使用cv2.threshold(灰度图,阈值,填充色,阈值类型）
# 其中填充色0-255是从纯黑色到纯白色
# RGB到灰度图转换公式：L = R * 299/1000 + G * 587/1000+ B * 114/1000
# 由于labelme官方代码本身得到的是RGB图，对于第一个类的配色是[R,G,B]=[128,0,0]，因此我们将其转换成灰度图后，
# 得到的灰度矩阵中标签处的值为128*0.299=38.272，取整后为38。
# 因此我们的cv2.threshold中的阈值可以填0-38，均可，只要高于这个值就会复制为255纯白，低于这个值，就会为0，纯黑。

bin_img = True 

for i, file_path in enumerate(filepath_list):
    src_label = "{}/label.png".format(os.path.join(label_from_PATH, filepath_list[i]))
    label_name = "{}.png".format(file_path)
    if bin_img:
        dest_label = cv2.imread(src_label) #cv2.imread()读取的图片默认是BGR的通道顺序dest_label[:,:,0]=B颜色通道
        dest_label = cv2.cvtColor(dest_label, cv2.COLOR_BGR2GRAY)#该方法将读取的图片转为RGB格式
        ret, dest_label = cv2.threshold(dest_label, 0, 255, cv2.THRESH_BINARY)
        cv2.imwrite(os.path.join(label_to_PATH, label_name), dest_label)
    else:
        shutil.copy(src_label, os.path.join(label_to_PATH, label_name))

    print("{} has been copied to {}".format(label_name, label_to_PATH))

print("All done!!!")

最终得到二值图像如下

在这里插入图片描述

经过灰度转换后的标签图如下：
在这里插入图片描述
未经过灰度转换后的标签图如下（是labelme默认的RGB[128,0,0]配色,近针对一个类别标签，其他标签配色会改变）：

在这里插入图片描述

将标签图像转换为二值图像（基于PIL和阈值)

我测试了该方法，但实际代码实践中未采用。

from PIL import Image
import numpy as np
label_path = "/Users/XXX/Documents/codespace/imageSeg0907/data/label_data3_crop_deleted/3034.png"
lab=Image.open(label_path)
# 我们知道PIL中有九种不同模式。分别为1，L，P，RGB，RGBA，CMYK，YCbCr，I，F； 默认是RGB模式读取彩色图
print(np.array(lab).shape)
print(np.unique(np.array(lab)))

lab = np.array(lab)
lab[lab>=1]=255 # 这个值需要提前根据图片判断好
img_arr = np.array(lab)
img_arr[img_arr>=38]=255
print(img_arr)
print(np.unique(img_arr))
img2 = Image.fromarray(img_arr)

 img.convert('L')
 　　为灰度图像，每个像素用8个bit表示，0表示黑，255表示白，其他数字表示不同的灰度。
　　 转换公式：L = R * 299/1000 + G * 587/1000+ B * 114/1000
img.convert('1')
The default method of converting a greyscale ("L") or "RGB"
        image into a bilevel (mode "1") image uses Floyd-Steinberg
        dither to approximate the original image luminosity levels. If
        dither is :data:`NONE`, all values larger than 127 are set to 255 (white),
        all other values to 0 (black). To use other thresholds, use the
        :py:meth:`~PIL.Image.Image.point` method.
 由官方代码说明可知， img.convert('1')的阈值默认是127，如果不想用这个阈值，则使用`~PIL.Image.Image.point` method方法，或者用上面代码中的方法，转化成矩阵之后手动修改。

图像切割操作

20张train图片，每张可以切成16张
一张1024*1024切成，16张 256✖️256
在这里插入图片描述

import pdb
import os
import shutil
from PIL import Image
import matplotlib.pyplot as plt

# crop_image_PATH = "D:\codespace\labelme\\0905img\label_json\\crop_train60"#没用到，在下面直接写了这个地址
image_PATH = "D:\codespace\labelme\\data3\\Y101H2_7B\\16\image"

filepath_list = os.listdir(image_PATH)
for i, file_path in enumerate(filepath_list):
    src_label = "{}".format(os.path.join(image_PATH, filepath_list[i]))
#     label_name = "D:\codespace\labelme\\0905img\label_json\\crop_train60\\{}".format('crop_'+filepath_list[i])
    img = Image.open(src_label)
#     plt.imshow(img)  # 展示图片
    for j in range(4):
        for k in range(4):    
            label_name = "D:\codespace\labelme\\data3\\Y101H2_7B\\16\image_data3_crop\\{}".format(str(j)+str(k)+filepath_list[i])
            crop_img = img.crop((k*256,j*256,(k+1)*256,(j+1)*256))
            crop_img.save(label_name)
#     break
print('finish')

手动挑选不用的图像

根据label观察全黑的图像（进行删除），其实有用，算是全负样本。
然后根据删除后的label 列表，删除image列表。生成最终的image_deleted和label_deleted文件夹。
注意：对于mac来说，会有一个叫做.DS_Store的文件在图片文件夹中，需要大家自动进入图片文件夹用命令行删除一下，命令行如下：

find ./ -name ".DS_Store" -depth -exec rm {} \;

# 根据手删的label图片文件夹中的文件名 删除 image图片文件夹中多余图片
import os
all_image_from_PATH = "/Users/XXX/Documents/codespace/imageSeg0907/data/label_data3_crop_deleted"
use_image_from_PATH = "/Users/XXX/Documents/codespace/imageSeg0907/data/image_data3_crop_deleted"
all_filepath_list = os.listdir(all_image_from_PATH)
use_filepath_list = os.listdir(use_image_from_PATH)
print(use_filepath_list)
print(len(all_filepath_list))
print(len(use_filepath_list))

i = 0
for image_name in all_filepath_list:
    # 如果在可用的图像列表中，则继续循环，否则推出循环
    if (image_name in use_filepath_list):
        continue
    else:
#         print(image_name) 
        i = i+1 #不在的个数
        os.remove(all_image_from_PATH+'/'+image_name)
# print(i)

后记：labelme生成的标注图像分析

在这里插入图片描述
我们以一张单一类别的标签为例。

一、PIL.Image.open
H×W×C，RGB，数据类型 PIL.JpegImagePlugin.JpegImageFile
通过 numpy.asarray(image_pil) 可转成 numpy.ndarray
二、cv2.imread
H×W×C，BGR，数据类型 numpy.ndarray
通过 cv2.cvtColor(image_cv2, cv2.COLOR_BGR2RGB) 可转成 RGB

注：以上两种库读取到的图片值不一定完全一样（就算都转成 RGB 的 ndarray 之后也），某些像素的值有可能会相差1。

CV2读取

import cv2 # open-cv
import numpy as np
import matplotlib.pyplot as plt
img = cv2.imread('label.png') #默认BGR方式读取,得到三通道数据类型numpy.ndarray

注：
v2.IMREAD_COLOR：加载彩色图片，这个是默认参数，可以直接写1。
cv2.IMREAD_GRAYSCALE：以灰度模式加载图片，可以直接写0。
cv2.IMREAD_UNCHANGED：包括alpha(包括透明度通道)，可以直接写-1
GRAY是灰度图，转换规则为： Gray = 0.299R + 0.587G + 0.114B # 单通道

CV2展示

import cv2 # open-cv
import numpy as np
import matplotlib.pyplot as plt
img = cv2.imread('label.png') #默认BGR方式读取,得到三通道数据类型numpy.ndarray
plt.imshow(img) #展示

在这里插入图片描述
我们发现展示出的图片的标注格式为蓝色，与红色不同。这是因为原始的标注格式读取进来的时候是BGR，但是plt.imgshow(img)展示默认放入的图片是RGB，因此需要先转换再展示。

import cv2 # open-cv
import numpy as np
import matplotlib.pyplot as plt
img = cv2.imread('label.png') #默认BGR方式读取,得到三通道数据
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
plt.imshow(img) #展示

CV2读取的图片分析

参考资料：labelme批量生成label后，如何获取对应标注颜色的rgb值，用于语义分割训练时的标注颜色说明文件的书写

类别标签颜色，默认按照labelme中默认代码的颜色,背景默认RGB都为0，全黑。
其余的颜色按照labelme原始代码从r=128,g=0,b=0开始。
在这里插入图片描述
CV2默认读取进来的数据就是这种格式，通常我们用灰度方式读取，合并为单通道的numpy数组矩阵，
其转化方式为：Gray = 0.299R + 0.587G + 0.114B

#统计矩阵中的数值有哪些
from collections import Counter # 计数
print(img[:,:,0].shape)
print(Counter(img[:,:,0].flatten()))  #结果是Counter({0: 1047396, 128: 1180})
print(Counter(img.flatten()))  #结果是Counter({0: 3144548, 128: 1180})

PIL读取标签图

from PIL import Image
pilimg = Image.open('中期考核/label1-7/1_label.png')
# pilimg.show() #展示标签图
print(np.array(pilimg).shape) # 标签图转换为numpy.narray
print(Counter(np.array(pilimg).flatten())) # 用PIL读取得到的就是单通道的标签从1，2，3分别代表类别
#Counter({0: 1047396, 1: 1180})

因此在实际的工程中我们更常使用PIL来处理盒转化标签图。

五阿哥爱跳舞

关注

9
点赞
踩
64

收藏

觉得还不错? 一键收藏
5
评论
windows安装labelme打标签并生成二值（黑白）标签图（也是一种特殊的灰度图）

1创建conda子环境conda create -n labelme python=3.7输入y回车2激活conda子环境conda activate labelme3安装依赖包conda install pyqtconda install pillow4安装labelmepip install labelme网络错误如果出现如下报错WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None
复制链接

扫一扫

专栏目录