- 实验目的
• 1、理解无监督学习中Kmeans算法原理
• 2、掌握Sklearn实现基于Kmeans的图像分割
- 实验内容与要求
1、图像分割
利用图像的灰度、颜色、纹理、形状等特征,把图像分成若干个互不重叠的区域,并使这些特征在同一区域内呈现相似性,在不同的区域之间存在明显的差异性。然后就可以将分割的图像中具有独特性质的区域提取出来用于不同的研究。
图像分割技术已在实际生活中得到广泛的应用。例如:在机车检验领域,可以应用到轮毂裂纹图像的分割,及时发现裂纹,保证行车安全;在生物医学工程方面,对肝脏CT图像进行分割,为临床治疗和病理学研究提供帮助。
2、实例描述
目标:利用K-means聚类算法对图像像素点颜色进行聚类实现简单的图像分割
输出:同一聚类中的点使用相同颜色标记,不同聚类颜色不同
技术路线:ssklearn.cluster.KMeans
实例数据:本实例中的数据可以是任意大小的图片,为了使效果更佳直观,可以采用区分度比较明显的图片。
3、实验过程
·使用算法:Kmeans
·实现步骤:
(1)建立工程并导入sklearn包
(2)加载图片并进行预处理
(3)加载Kmeans聚类算法
(4)对像素点进行聚类并输出
- 实验程序与结果
import os
import numpy as np
from PIL import Image
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
os.environ['LOKY_MAX_CPU_COUNT'] = '4'
def loadData(filePath): # 加载图像并进行预处理,将像素值归一化到0-1之间。
try:
img = Image.open(filePath) # 打开图像文件
except FileNotFoundError:
raise FileNotFoundError(f"文件路径 {filePath} 不存在,请检查路径。")
img = img.convert('RGB') # 确保图像是RGB格式
data = []
m, n = img.size # 获取图像的尺寸
for i in range(m): # 将每个像素点的RGB颜色处理到0-1
for j in range(n):
x, y, z = img.getpixel((i, j))
data.append([x / 256.0, y / 256.0, z / 256.0]) # 范围内并存入data
return np.array(data), m, n # 以数组的形式返回data,以及图像尺寸
def createSegmentedImage(labels, centers, row, col): # 根据聚类结果创建分割后的图像。
segmented_img = Image.new('RGB', (row, col))
for i in range(row):
for j in range(col):
cluster_idx = labels[i * col + j]
color = tuple((centers[cluster_idx] * 256).astype(int))
segmented_img.putpixel((i, j), color)
return segmented_img
def segmentImage(filePath, n_clusters): # 利用K-means聚类算法对图像像素点颜色进行聚类,实现简单的图像分割。
imgData, row, col = loadData(filePath)
# 加载KMeans聚类算法
km = KMeans(n_clusters=n_clusters)
km.fit(imgData)
# 获取每个像素所属的类别
labels = km.labels_
centers = km.cluster_centers_
# 读取原始图像
original_img = Image.open(filePath)
# 创建分割后的图像
segmented_img = createSegmentedImage(labels, centers, row, col)
# 使用subplot同时显示原图和分割后的图像
plt.figure(figsize=(12, 6))
plt.subplot(1, 2, 1)
plt.imshow(original_img)
plt.title('Original Image')
plt.axis('off')
plt.subplot(1, 2, 2)
plt.imshow(segmented_img)
plt.title('Segmented Image')
plt.axis('off')
plt.show()
if __name__ == "__main__":
path = 'D:/Python/Pythonproject/Pythonproject1/K_means_10.jpg'
n_clusters = 3 # 设置聚类的数量
segmentImage(path, n_clusters)
四、实验结果分析
原始图像展示了图像的所有细节和颜色,包含大量的颜色信息和细节。分割后的图像使用3个聚类中心颜色替换原图中的颜色,从而将图像简化为3个主要颜色区域。这些颜色区域代表了图像中的主要颜色成分,去除了细节颜色的干扰,使图像更加简洁,突出了主要颜色区域。
聚类效果依赖于图像的内容和颜色分布。对于颜色差异明显的图像,聚类效果较好,可以清晰地区分不同颜色区域。对于颜色渐变和细节丰富的图像,聚类可能会导致一些细节丢失,但仍能突出主要颜色区域。
五、实验问题解答与体会
通过本次实验,我深刻体会到了图像处理的基础知识和K-means聚类算法在图像分割中的实际应用。加载图像、处理像素值和转换图像格式的过程加深了我对图像处理技术的理解。通过实施K-means聚类算法,对图像像素进行颜色聚类,并将聚类结果应用于图像分割,使我直观地理解了聚类算法的原理和效果。
此外,通过对实验结果的分析,我认识到K-means聚类在图像分割中的应用效果较好,但仍有改进空间,如调整聚类数量和进行图像的预处理与后处理。总体而言,本次实验不仅加强了我对图像处理和聚类算法的理论理解,更提升了我的实践能力和分析问题的能力。