基于MATLAB的K-Means聚类算法在图像主导颜色提取中的应用

机器学习课程设计大纲,应付课程,毫无寄术含量,随便写写的,本来想整个图像分割,但是,懒。

摘要

本研究旨在开发一种基于 MATLAB 的图像处理工具,用于对图像进行聚类分析和颜色频率统计。MATLAB利用 k-means 聚类算法将图像像素分组成不同的类别,并生成聚类后的图像以及各个类别的频率信息。该研究可为图像处理领域的研究人员和从业者提供一个便捷、高效的工具,用于图像分析和色彩统计。

关键词:MATLAB、图像处理、聚类分析、颜色频率统计、k-means算法

图清单

图序号图名称页码
图1-1流程图5
图2-1量测常见的4种情况7
图3-1K聚类前后图像对比8
图3-2聚类频率分布图9
图3-3主导颜色提取图10
图3-4轮廓系数图11

表清单

表序号表名称页码
表2-1混淆矩阵7
表3-1误差平方和11

变量注释表

目录

1 绪论

1.1 研究背景

随着数字图像处理技术的发展,图像的分析和理解已成为计算机视觉、模式识别及多媒体应用中的重要课题。图像中的颜色信息对于许多应用场景而言至关重要,包括图像检索、图像分割、目标识别和图像增强等。快速而准确地提取图像的主导颜色不仅有助于这些应用的实现,还能有效提升系统的响应速度和处理效能。

传统的颜色提取方法主要依赖于统计分析和直方图处理,而这些方法在应对复杂和高维图像数据时可能变得效率低下和不准确。K-Means聚类算法作为一种常见的非监督机器学习方法,具有高效、简便且易于实现的特点,适合用于图像颜色的聚类分析和主导颜色的提取。

MATLAB作为一种强大的科学计算和工程工具,提供了丰富的图像处理工具箱,使得图像处理算法的开发和实现变得更加简便。利用MATLAB的强大功能,可以快速实现基于K-Means聚类算法的图像颜色提取和分析。MATLAB的图形用户界面(GUI)进一步简化了用户的操作,允许用户轻松选择和处理图像,从而大大提升了图像处理的便捷性和效率。

在这种背景下,使用K-Means聚类提取主导颜色提供了一种有效的方法,可以总结和简化图像的颜色信息。通过将相似颜色聚类在一起,该算法能够在保留图像基本颜色特征的同时,有效减少图像数据的复杂性。这种方法在颜色起关键作用的多个应用领域具有显著的实用价值,如数字营销中的色彩设计和分析、艺术品保存中的颜色修复指导以及制造业中的自动化质量控制。

1.2 研究现状

K-Means聚类算法是一种经典的无监督学习算法,在图像处理领域中得到了广泛应用,尤其在图像主导颜色提取方面显示出了显著的价值。基于MATLAB的K-Means聚类算法凭借其强大的数学计算和可视化能力,成为研究和应用中的重要工具。

随着计算机视觉和图像处理技术的不断发展,提取图像中的主导颜色在许多实际应用中显得尤为重要。例如,在图像压缩、内容检索、图像分类以及视觉感知增强等领域,准确识别和提取图像的主导颜色能够显著提升算法的效率和效果。MATLAB因其丰富的图像处理工具箱和简便的编程环境,成为研究人员和工程师进行图像处理研究和开发的首选平台之一。

K-Means算法通过将数据划分为K个簇,最小化簇内数据点到簇中心的距离平方和。其基本步骤包括随机选择K个初始簇中心,将每个数据点分配到距离最近的簇中心,重新计算每个簇的中心,重复上述步骤直到簇中心不再变化或达到最大迭代次数。MATLAB提供了强大的函数库,可以方便地实现K-Means聚类算法。在图像主导颜色提取中,常见的流程是读取图像并转换为二维数组,每行代表一个像素的RGB值,使用MATLAB内置的kmeans函数对像素进行聚类,统计每个簇的像素数量,提取包含最多像素的簇作为主导颜色。

近年来,基于MATLAB的K-Means聚类在图像主导颜色提取中的应用取得了不少进展和创新。首先,为了解决传统K-Means算法初始簇中心选择敏感的问题,研究者们提出了改进的K-Means变种,如K-Means++、MiniBatch K-Means等,以提高算法的稳定性和收敛速度。其次,在RGB颜色空间直接应用K-Means聚类有时会受到颜色分布的非均匀性影响。研究者们尝试将图像转换到其他颜色空间(如HSV、Lab)进行聚类,以获得更符合人眼感知的主导颜色。此外,为了提升主导颜色提取的准确性和鲁棒性,K-Means聚类常常与其他图像处理技术结合使用。例如,结合边缘检测和形态学处理,可以在聚类前进行预处理,提高颜色提取的精度。最后,基于K-Means的主导颜色提取不仅在静态图像处理中取得了应用,还在视频处理、实时监控和增强现实等动态场景中展现出广阔的应用前景。

随着深度学习和人工智能技术的发展,基于K-Means聚类的传统图像处理方法将继续与新兴技术融合发展。未来的研究方向可能包括深度学习与K-Means聚类的结合,利用深度特征提取提升聚类效果;基于图像语义理解的主导颜色提取,使提取结果更加符合人类认知;更高效的实时处理算法,以满足视频处理和交互式应用的需求。

1.3 研究的目标和内容

本研究的主要目标是探索基于MATLAB的K-Means聚类算法在图像主导颜色提取中的应用,通过改进算法和优化处理流程,提升图像主导颜色提取的精度和效率。

本研究旨在实现图像的主导颜色提取。具体而言,通过使用MATLAB实现K-Means聚类算法,对输入图像进行聚类分析,从而提取出图像中的主导颜色。聚类分析将图像中的像素分组,识别出图像中占主导地位的颜色,并显示聚类后的图像。

1.4 论文组织结构

阐明研究背景及意义
确定研究内容与方法
聚类算法结果度量
实验结果分析
得出研究结论
RGB颜色空间转换
K-Means聚类分析
图1-1 流程图

2 理论基础与方法

2.1 K-均值算法

已知观测集 ( x 1 , x 2 , . . . , x n ) {\displaystyle (x_{1},x_{2},...,x_{n})} (x1,x2,...,xn),其中每个观测都是一个 d {\displaystyle d} d-维实向量,k-均值聚类要把这
n {\displaystyle n} n个观测划分到k个集合中(k≤n),使得组内平方和(WCSS within-cluster sum of squares)最小。换句话说,它的目标是找到使得下式满足的聚类 S i {\displaystyle S_{i}} Si
arg min ⁡ S ∑ i = 1 k ∑ x ∈ S i ∥ x − μ i ∥ 2 {\displaystyle {\underset {\mathbf {S} }{\operatorname {arg\,min} }}\sum _{i=1}^{k}\sum _{\mathbf {x} \in S_{i}}\left\|\mathbf {x} -{\boldsymbol {\mu }}_{i}\right\|^{2}} Sargmini=1kxSixμi2
其中 μ i {\displaystyle \mu _{i}} μi S i {\displaystyle S_{i}} Si中所有点的均值。

2.2 三原色光模式

三原色光模式(RGB color model,又称RGB表色系统、RGB颜色模型、红绿蓝颜色模型,是一种加色模型,将红(Red)、绿(Green)、蓝(Blue)三原色的色光以不同的比例相加混色,以合成产生各种色彩光。1

以彩色图像为例:基于彩色图像的RGB三通道为xyz轴建立空间直角坐标系,那么一副图像上的每个像素点与该空间直角坐标系建立了一一映射(双射)的关系。

从空间直角坐标系中随机取k个点,作为k个簇的各自中心。计算所有像素点到这k个簇心的距离,并将所有像素点划分至与其距离最小的簇类。自此聚类完成。距离定义为欧氏距离:

Distance = ( r 1 − r 0 ) 2 + ( g 1 − g 0 ) 2 + ( b 1 − b 0 ) 2 { \text{Distance} = \sqrt{(r_1 - r_0)^2 + (g_1 - g_0)^2 + (b_1 - b_0)^2} } Distance=(r1r0)2+(g1g0)2+(b1b0)2

其中, r r r g g g b b b分别表示红、绿、蓝三通道, r 1 r_1 r1 g 1 g_1 g1 b 1 b_1 b1为彩色图像中某像素点的值; r 0 r_0 r0 g 0 g_0 g0 b 0 b_0 b0表示某簇类的簇心的值。

2.3 SSE误差平方和

SSE是衡量聚类算法性能的一个指标,用于评估数据点与其对应簇中心之间的距离之和。具体来说,它是所有数据点到其聚类中心(质心)的欧氏距离的平方和。公式如下:
SSE = ∑ i = 1 k ∑ x ∈ C i ∥ x − μ i ∥ 2 \text{SSE} = \sum_{i=1}^{k} \sum_{x \in C_i} \| x - \mu_i \|^2 SSE=i=1kxCixμi2
其中:
k k k是聚类的簇数。
C i C_i Ci是第 i i i个簇。
x x x是属于簇 C i C_i Ci的数据点。
μ i \mu_i μi是第 i i i个簇的中心(质心)。
∥ x − μ i ∥ \| x - \mu_i \| xμi表示数据点 x x x到簇中心 μ i \mu_i μi的欧氏距离。

2.4 轮廓系数法

假设某一数据集使用如k-means等聚类方法分成了 k {\displaystyle k} k个簇:
对于某一属于簇 C i {\displaystyle C_{i}} Ci样本 i {\displaystyle i} i,记为 i ∈ C i {\displaystyle i\in C_{i}} iCi,设 d ( i , j ) {\displaystyle d(i,j)} d(i,j)为样本 i {\displaystyle i} i j {\displaystyle j} j之间的距离,求算样本 i {\displaystyle i} i与其他样本之间的平均距离的公式如下(由于不计算样本与自身的距离 d ( i , i ) {\displaystyle d(i,i)} d(i,i),故计算平均值时样本总数为 ∣ C i ∣ − 1 ) {\displaystyle |C_{i}|-1}) Ci1
a ( i ) = 1 ∣ C i ∣ − 1 ∑ j ∈ C i , i ≠ j d ( i , j ) {\displaystyle a(i)={\frac {1}{|C_{i}|-1}}\sum _{j\in C_{i},i\neq j}d(i,j)} a(i)=Ci11jCi,i=jd(i,j)
上述公式结果记为 a ( i ) {\displaystyle a(i)} a(i),它反映了样本 i {\displaystyle i} i当前聚类结果的优劣(值越小,聚类结果越好)。2

2.3 F1分数

F1分数,亦被称做F-measure,是一种量测算法的精确度常用的指标,经常用来判断算法的精确度。目前在辨识、侦测相关的算法中经常会分别提到精确率(precision)和召回率(recall),F-score能同时考虑这两个数值,平衡地反映这个算法的精确度。

一般上来说,提到F-score且没有特别的定义时,是指 β = 1 {\displaystyle \beta =1} β=1时的F-score,亦有写作F1-score。代表使用者同样的注重precision和recall的这两个指标。其分数可以说是precision和recall的调和平均,式子如下:

F 1 − s c o r e      =      2    p r e c i s i o n    ×    r e c a l l p r e c i s i o n    +    r e c a l l {\displaystyle F1-score\;\;=\;\;2\;{\frac {precision\;\times \;recall}{precision\;+\;recall}}} F1score=2precision+recallprecision×recall
F-score最理想的数值是趋近于1,做法是让precision和recall都有很高的值。若两者皆为1,使得 2 ⋅ 1 2 = 1 {\displaystyle 2\cdot {\frac {1}{2}}=1} 221=1,则F-score = 1 (100%),代表该算法有着最佳的精确度。3

在这里插入图片描述

图2-1 量测常见的4种情况
判断为真判断不为真
事实上为真TPFN
事实上不为真FPTN
表2-1 混淆矩阵

Precision和Recall
p r e c i s i o n = T P T P + F P = + P      ( p o s i t i v e p r e d i c t i o n r a t e ) {\displaystyle precision={\frac {TP}{TP+FP}}=+P\;\;} (positive prediction rate) precision=TP+FPTP=+P(positivepredictionrate)

Precision的分母为两种判断为真的情形的总和(范恩图中完整绿色的部分)

当辨识结果为FP的代价很高时,F-score应该着重此指标,亦即precision要很高。

r e c a l l = T P T P + F N {\displaystyle recall={\frac {TP}{TP+FN}}} recall=TP+FNTP

Recall的分母为事实上为真的情形的总和(范恩图中完整紫色的部分)

3 有关主导颜色提取的影响因素分析

3.1 F1分数评估

在这里插入图片描述

图3-1 K聚类前后图像对比

在这里插入图片描述

图3-2 聚类频率分布图

在这里插入图片描述

图3-3 主导颜色提取图

3.2 SSE误差平方和

以上图片matlab运行返回结果如下:

请输入k值:3
请输入下采样因子 (例如 2 表示宽高均减半):10
Starting parallel pool (parpool) using the 'local' profile ... connected to 4 workers.
主导颜色: 
    0.5315    0.6092    0.6322

Sum of Squared Errors (SSE): 14165649.932
Mean Silhouette Coefficient: 0.72616

运用matlab预设图像pears.png,改变k值进行多次实验

k值采样因子SSE
3103359709.7729
5101854512.5611
1010879188.886
582869176.3141
557498573.6402
表3-1 误差平方和

3.3 轮廓系数法

在这里插入图片描述

图3-4 轮廓系数图

4 结论和建议

4.1 结论

本研究开发了一种基于 MATLAB 的图像处理工具,能够利用 k-means 聚类算法对图像进行聚类分析,并准确统计颜色频率。实验结果表明,该工具在处理不同类型的图像时表现出较高的准确性和有效性。

4.2 建议

4.2.1 进一步优化算法

虽然 k-means 聚类算法简单高效,但在处理大型图像或高维数据时,计算效率会受到影响。应当考虑结合其他优化算法,如基于图的聚类算法或深度学习算法,以提高处理速度和精度。

4.2.2 增加功能模块

在现有功能的基础上,可以扩展更多的图像处理功能,如边缘检测、图像增强、形态学处理等,以满足不同应用场景的需求。

参考文献

原始代码:

clc;
clear all;
close all;
warning off;

% 选择图像文件
[filename, pathname] = uigetfile('*.*', '选择一张图片');

if isequal(filename, 0) || isequal(pathname, 0)
    disp('用户取消选择');
else
    filename = strcat(pathname, filename);
    rgbImage = imread(filename);

    % 显示原始图像
    imshow(rgbImage);
    title('原始图像');

    % 输入 k 值
    k = input('请输入k值:');
    close;

    % 执行 k-means 聚类
    redChannel = rgbImage(:, :, 1);
    greenChannel = rgbImage(:, :, 2);
    blueChannel = rgbImage(:, :, 3);
    data = double([redChannel(:), greenChannel(:), blueChannel(:)]);
    numberOfClasses = k;
    [m, n] = kmeans(data, numberOfClasses);
    m = reshape(m, size(rgbImage, 1), size(rgbImage, 2));
    n = n / 255;
    clusteredImage = label2rgb(m, n);
    
    % 显示聚类前后图像对比
    subplot(1,2,1);
    imshow(rgbImage);
    title('原始图像');
    subplot(1, 2, 2);
    imshow(clusteredImage);
    title('聚类后的图像');

    % 计算每个聚类的频率
    frequency = [];
    temp = 0;
    for i = 1:k
        for a = 1:size(rgbImage, 1)
            for b = 6:size(rgbImage, 2)
                if m(a, b) == i
                    temp = temp + 1;
                end
            end
        end
        frequency = [frequency temp];
        temp = 0;
    end

    % 显示聚类频率的饼图
    figure;
    pie(frequency);
    colormap(n); % 定义颜色方案

    % 显示主导颜色
    [ma, na] = max(frequency);
    disp(n(na, :));
    figure;
    patch([0 0 10 10], [0 10 10 0], n(na, :));
    title('主导颜色');
end

结果分析代码:

clc;
clear all;
close all;
warning off;

% 选择图像文件
[filename, pathname] = uigetfile('*.*', '选择一张图片');

if isequal(filename, 0) || isequal(pathname, 0)
    disp('用户取消选择');
else
    filename = fullfile(pathname, filename);
    rgbImage = imread(filename);

    % 显示原始图像
    imshow(rgbImage);
    title('原始图像');

    % 输入 k 值
    k = input('请输入k值:');
    close;

    % 输入下采样因子
    downsampleFactor = input('请输入下采样因子 (例如 2 表示宽高均减半):');
    
    % 下采样图像
    if downsampleFactor > 1
        rgbImage = imresize(rgbImage, 1/downsampleFactor);
    end

    % 执行 k-means 聚类
    redChannel = rgbImage(:, :, 1);
    greenChannel = rgbImage(:, :, 2);
    blueChannel = rgbImage(:, :, 3);
    data = double([redChannel(:), greenChannel(:), blueChannel(:)]);
    numberOfClasses = k;
    
    % 使用并行计算进行 k-means 聚类
    opts = statset('UseParallel', 1);
    [m, n, sumd] = kmeans(data, numberOfClasses, 'Options', opts); % 返回 sumd
    clusteredLabels = reshape(m, size(rgbImage, 1), size(rgbImage, 2));
    n = n / 255;
    clusteredImage = label2rgb(clusteredLabels, n);
    
    % 显示聚类前后图像对比
    subplot(1, 2, 1);
    imshow(rgbImage);
    title('原始图像');
    subplot(1, 2, 2);
    imshow(clusteredImage);
    title('聚类后的图像');

    % 计算每个聚类的频率
    frequency = zeros(1, k);
    for i = 1:k
        frequency(i) = sum(m == i);
    end

    % 显示聚类频率的饼图
    figure;
    pie(frequency);
    colormap(n); % 定义颜色方案

    % 显示主导颜色
    [~, na] = max(frequency);
    disp('主导颜色: ');
    disp(n(na, :));
    figure;
    patch([0 0 10 10], [0 10 10 0], n(na, :));
    title('主导颜色');
    
    % 计算并显示SSE
    sse = sum(sumd);
    disp(['Sum of Squared Errors (SSE): ', num2str(sse)]);
    
    % 计算并显示轮廓系数
    silhouette_values = silhouette(data, m);
    mean_silhouette = mean(silhouette_values);
    disp(['Mean Silhouette Coefficient: ', num2str(mean_silhouette)]);
    figure;
    silhouette(data, m);
    title('Silhouette Plot');
end

  1. 邵丹, 韩家伟. YUV 与 RGB 之间的转换[J]. 长春大学学报, 2004, 14(4): 51-53. ↩︎

  2. 朱连江, 马炳先, 赵学泉. 基于轮廓系数的聚类有效性分析[J]. 计算机应用, 2010 (12): 139-141. ↩︎

  3. Yedidia A. Against the F-score[J]. URL: https://adamyedidia. files. wordpress. com/2014/11/fscore. pdf, 2016. ↩︎

  • 30
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值