1、问题:
问题:使用kmeans对图片颜色进行聚类
RGB图像,每个像素点值范围0-255
原始图像每个点的取值在0-255之间,也就是说,每个点都可以有256种颜色可以选择,所以每个像素点需要用8byte进行存储,现在我们希望用16种颜色对其进行表示,也就是每个像素点只需4byte
2、解题
0、导包:
import numpy as np
import scipy.io as sio
import matplotlib.pyplot as plt
from skimage import io
导入新包:skimage
1、导入数据:
data = sio.loadmat(path)
# print(data.keys())
A = data['A']
print(A.shape)
image = io.imread(img_path)
plt.imshow(A)
plt.show()
结果:
其中png与mat格式的图像经过plt.imshow()都是此图
mat文件中对每个点显示的颜色都进行了设置
2、对A进行标准化,加快聚类速度
#1、对A进行标准化
A = A/255
A = A.reshape(-1,3)
不知道为啥对A reshape成(-1,3)?
前置知识:Python官方解释 -1 是不指定的意思,这意思就是,我就要把它变成3列,多少行,机器自己算
3、引入聚类方法:
#获取标签所属类别
def find_centroids(X,centros):
idx=[]
for i in range(len(X)):
#(2,)(k,2)->(k,2)
dist = np.linalg.norm((X[i]-centros),axis=1)#(k,)求平方和再开方
id_i = np.argmin(dist)
idx.append(id_i)
return np.array(idx)
centros = np.array([[3,3],[6,2],[8,5]])
# idx = find_centroids(X,centros)
# print(idx)
#计算聚类中心点
def compute_centros(X,idx,k):
centros = []
for i in range(k):
centros_i = np.mean(X[idx==i],axis=0)
# print(centros_i)
centros.append(centros_i)
return np.array(centros)
# print(compute_centros(X,idx,k=3))
#运行Kmeans,重复执行1和2
def run_kmeans(X,centros,iters):
k = len(centros)
centros_all = []
centros_all.append(centros)
centros_i = centros
for i in range(iters):
idx = find_centroids(X,centros_i)
centros_i = compute_centros(X,idx,k)
centros_all.append(centros_i)
return idx,np.array(centros_all)
4、使用16个点对图像进行聚类,意思是每个点都有16中颜色可选
k=16
idx,centros_all = run_kmeans(A,init_centros(A,k),iters=20)
centros = centros_all[-1]
#最后一次聚类的16个值
#print(centros)
im = np.zeros(A.shape)
#初始化一个新的图像,对图像中的各个地方进行赋值
for i in range(k):
im[idx==i] = centros[i]
#将im reshape成原来的大小
im = im.reshape(128,128,3)
#显示
plt.imshow(im)
plt.show()
结果:
原图: