读取一张示例图片或自己准备的图片,观察图片存放数据特点。
根据图片的分辨率,可适当降低分辨率。
再用k均值聚类算法,将图片中所有的颜色值做聚类。
然后用聚类中心的颜色代替原来的颜色值。
形成新的图片。
观察原始图片与新图片所占用内存的大小。
将原始图片与新图片保存成文件,观察文件的大小。
from sklearn.datasets import load_sample_image from sklearn.cluster import KMeans import matplotlib.pyplot as plt import numpy as np #load_sample_image包的示例图片加载 china = load_sample_image("china.jpg") plt.imshow(china) plt.show() print(china.shape) flower = load_sample_image("flower.jpg") plt.imshow(flower) plt.show() print(flower.shape) plt.imshow(flower[:,:,0]) #改变图片色调,使图片失真 plt.show()
# mtaplotlib加载图片 import matplotlib.image as img lm = img.imread("C:\\Users\\PC\\Desktop\\tp\\lm.jpg") #读入图片路径 plt.imshow(lm) plt.show() print(lm.shape) lms = lm[::3,::3] #降低分辨率 plt.imshow(lm) plt.show() X = lms.reshape(-1,3) # 重造数组n_colors= 64 #(256,256,256) model= KMeans(n_colors) labels = model.fit_predict(X) #每个点的颜色分类,0-63 colors = model.cluster_centers_ #64个聚类中心,颜色值 print(lm.shape,lms.shape,X.shape)
#聚类 n_colors= 64 #(256,256,256) model= KMeans(n_colors) labels = model.fit_predict(X) #每个点的颜色分类,0-63 colors = model.cluster_centers_ #64个聚类中心,颜色值 # 以colors作为主体,labels作为下标,每个元素都替换成相应类别对应的中心值 new_lms = colors[labels] # 还原成原来的维度并转换数据类型 new_lms = new_lms.reshape(lms.shape) plt.imshow(new_lms.astype(np.uint8)) plt.show plt.imshow(lms); plt.show()
#保存图片 plt.imsave('C:\\Users\\PC\\Desktop\\tp\\lm.jpg',lm) plt.imsave('C:\\Users\\PC\\Desktop\\tp\\lms.jpg',lms) import sys # 压缩前后对比 size1 = sys.getsizeof('C:\\Users\\PC\\Desktop\\tp\\lm.jpg') size2 = sys.getsizeof('C:\\Users\\PC\\Desktop\\tp\\lms.jpg') print('压缩前:'+str(size1),"\t压缩后:"+str(size2))
理解贝叶斯定理:
- M桶:7红3黄
- N桶:1红9黄
- 现在:拿出了一个红球
- 试问:这个红球是M、N桶拿出来的概率分别是多少?