机器学习案例:k-means用于色彩压缩——基于Scikit-Learn

《Python数据科学手册》笔记

聚类算法的一个有趣应用是图像色彩压缩。高分辨率的图像可能包含几百万种颜色,但是其实很大一部分色彩通常不会被眼睛注意到,而且图像中的很多像素都拥有类似或者相同的颜色,因此,在需要的时候,我们可以对其进行压缩。在此,用k-means实现对一幅包含几百万种颜色的图像将近一百万压缩比的压缩处理。

图像来源:Scikit-Learn的datasets模块,原图像存储在一个三维数组(height,width,RGB)中,以0~255的整数表示红/蓝/绿信息。

压缩步骤为:

1.首先将数据变形为[n_samples,n_features]的特征矩阵形式,然后缩放颜色至其取值为0~1

2.然后对像素空间(特征矩阵)使用k-means聚类,将1600万种颜色缩减到16种颜色。

3.用计算的结果对原始像素重新着色,即每个像素被指定为距离其最近的簇中心点的颜色。

原图和压缩图如下:

虽然压缩后的图片丢失了某些细节,但是图像总体上还是非常容易辨识的。

代码如下:

from sklearn.datasets import load_sample_image
china = load_sample_image("china.jpg")
data = china / 255.0 #将其颜色值转换成0~1区间值
data = data.reshape(427*640,3) #将数据变形为[n_samples,n_features]矩阵格式
#用16中颜色对图像进行聚类
from sklearn.cluster import MiniBatchKMeans
kmeans = MiniBatchKMeans(16) 
kmeans.fit(data)
new_colors = kmeans.cluster_centers_[kmeans.predict(data)]
china_recolored = new_colors.reshape(china.shape)
fig,ax = plt.subplots(1,2,figsize=(16,6),subplot_kw=dict(xticks=[],yticks=[]))
fig.subplots_adjust(wspace=0.05)
ax[0].imshow(china)
ax[0].set_title('Original Image',size=16)
ax[1].imshow(china_recolored)
ax[1].set_title('16-color Image',size=16)

 

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值