基于K-means的HSV颜色空间聚类

最新推荐文章于 2022-11-03 20:39:29 发布

zzubqh103

最新推荐文章于 2022-11-03 20:39:29 发布

阅读量3.2k

点赞数 9

分类专栏：图像处理文章标签： kmeans算法颜色聚类主题色提取

本文链接：https://blog.csdn.net/qq_36810544/article/details/102687097

版权

图像处理专栏收录该内容

16 篇文章 6 订阅

订阅专栏

主题色提取，轮廓分割（粗略的）都是这玩意儿。打标签打的我开始怀疑人生了，人生第一次对自己是不是色盲产生了怀疑，由于人眼的视觉暂留现象，当对样本的颜色标记稍微一多，就分不清红，淡红，紫，青，连黑都会怀疑。这些样本是要用来训练神经网络的，自然在打标签阶段是没法使用有监督的算法的，辣么只好请聚类算法帮帮忙啦，给我个大体颜色，辅助我判别颜色即可。当然，用这个来做粗略的图片分割也还行，精确的语义分割还是使用神经网络吧。
定妆照：
在这里插入图片描述
凭肉眼判断当k为6或7的时候效果最好，分别计算每次聚类后的Calinski-Harabasz分数，分数越大效果越好。得到的分数如下：

k = 2, score is: 932242.9272316165
k = 3, score is: 1169809.7584967643
k = 4, score is: 1320552.7392092757
k = 5, score is: 1345779.5298866413
k = 6, score is: 1379396.1119608313
k = 7, score is: 1339665.7312545856
k = 8, score is: 1329260.4117795974
k = 9, score is: 1308507.892208983
k = 10, score is: 1301792.413308266
best k is: 6

同肉眼的判断一致。
颜色空间转换和kmeans算法都是直接调的API，已经过了自己造轮子的年龄，高效且正确的完成任务才是第一位的 ?，请叫我“调包侠”
========================= 不给源码的都是耍流氓=====================

# -*- coding:utf-8 -*-
# name: ColorTool
# 在HSV空间下，利用k-means进行颜色聚类
# author: bqh
# datetime:2019/10/22 10:35
# =========================

import numpy as np
import cv2
from sklearn.cluster import KMeans
import math
import matplotlib.pyplot as plt
from PIL import Image
from pylab import *
from sklearn import metrics


def color_cluster(img_file, k=3):
    """
    计算输入图像在HSV空间的聚类结果
    :param img_file: 图片文件路径
    :param k: 类别数
    :return: 返回聚类结果，标签值， 每个值的总数， 标签对应的rgb值, 本次聚类的得分， 像素的标签矩阵。numpy的array格式
    """
    img = cv2.imread(img_file)
    data = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
    data = data.reshape((-1, 3))
    kmeans = KMeans(n_clusters=k).fit(data)
    pixel_label = kmeans.labels_

    # 计算聚类得分，Calinski-Harabasz分数值越大聚类结果越好
    ch_score = metrics.calinski_harabaz_score(data, pixel_label)

    label_value = set(list(pixel_label))
    label_count = []
    hsv_avg = []
    for value in label_value:
        label_count.append(np.sum(pixel_label == value))
        hsv_mean = (np.sum(data[pixel_label == value], axis=0) / np.sum(pixel_label == value)).astype(np.uint8)
        hsv_avg.append(hsv_mean)
    hsv_array = np.reshape(np.array(hsv_avg), (k, 1, 3))
    rgb_array = cv2.cvtColor(hsv_array, cv2.COLOR_HSV2RGB)
    rgb_array = np.reshape(rgb_array, (k, 3))
    return np.array(list(label_value)), np.array(label_count), rgb_array, ch_score, pixel_label


def show(label_value, label_count, rgb_array, k, raw_img, render_img):
    # 可视化显示
    # 设置默认字体，否则中文乱码
    mpl.rcParams['font.family'] = "SimHei"
    plt.subplot(221)
    plt.title(u'原图')
    plt.imshow(raw_img)

    plt.subplot(222)
    plt.title(u'主色统计')
    plt.bar(label_value, label_count, 0.5, alpha=0.4, color='g', label='Num')

    plt.subplot(223)
    plt.title(u'主色排序')
    color_img = np.zeros((400, k * 200, 3), dtype=np.uint8)
    for i in range(k):
        color_img[:, i * 200: (i + 1) * 200] = rgb_array[i]
    color_img = Image.fromarray(color_img)
    plt.imshow(color_img)

    plt.subplot(224)
    plt.imshow(render_img)
    plt.show()


def show2(raw_img, renders, start_k):
    mpl.rcParams['font.family'] = "SimHei"
    total_imgs = len(renders) + 1
    # 向上取整
    n_row = math.ceil(total_imgs / 4)
    plt.subplot(n_row, 4, 1)
    plt.title(u'原图')
    plt.imshow(raw_img)
    for index, render_img in enumerate(renders):
        plt.subplot(n_row, 4, index + start_k)
        plt.title('k = {0}'.format(index + start_k))
        plt.imshow(render_img)
    plt.show()


def render(img_size, pixel_label, label_value, rgb_array):
    img_shape = (img_size[1], img_size[0], 3)
    img = np.zeros(img_shape, dtype=np.uint8)
    pixel_label = np.reshape(pixel_label, (img_size[1], img_size[0]))
    for i, value in enumerate(label_value):
        img[pixel_label == value] = rgb_array[i]
    render_img = Image.fromarray(img)
    return render_img


if __name__ == '__main__':
    img_file = r'E:\code\Tongue\ColorClassify\train_data\tongue\image\22.jpg'
    max_score = -1000
    renders = []
    best_k = -1
    raw_img = Image.open(img_file)
    for k in range(2, 11):
        label_value, label_count, rgb_array, score, pixel_label = color_cluster(img_file, k)
        render_img = render(raw_img.size, pixel_label, label_value, rgb_array)
        renders.append(render_img)
        # show(label_value, label_count, rgb_array, k, raw_img, render_img)
        if max_score < score:
            max_score = score
            best_k = k
        print('k = {0}, score is: {1}'.format(k, score))
    print('best k is: {0}'.format(best_k))
    show2(raw_img, renders, 2)

zzubqh103

关注

9
点赞
踩
33

收藏

觉得还不错? 一键收藏
0
评论
基于K-means的HSV颜色空间聚类

主题色提取，轮廓分割（粗略的）都是这玩意儿。打标签打的我开始怀疑人生了，人生第一次对自己是不是色盲产生了怀疑，由于人眼的视觉暂留现象，当对样本的颜色标记稍微一多，就分不清红，淡红，紫，青，连黑都会怀疑。这些样本是要用来训练神经网络的，自然在打标签阶段是没法使用有监督的算法的，辣么只好请聚类算法帮帮忙啦，给我个大体颜色，辅助我判别颜色即可。当然，用这个来做粗略的图片分割也还行，精确的语义分割还是使用...
复制链接

扫一扫