1. 用K-means算做图片压缩
读取一张示例图片或自己准备的图片,观察图片存放数据特点。
根据图片的分辨率,可适当降低分辨率。
再用k均值聚类算法,将图片中所有的颜色值做聚类。
然后用聚类中心的颜色代替原来的颜色值。
形成新的图片。
观察原始图片与新图片所占用内存的大小。
将原始图片与新图片保存成文件,观察文件的大小。
from sklearn.datasets import load_sample_image
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import numpy as np
flower = load_sample_image("flower.jpg")
#plt.imshow(flower)
#plt.show()
image = flower[::2,::2] #降低分辨率
#plt.imshow(image)
#plt.show()
X = image.reshape(-1,3)
print(flower.shape,image.shape,X.shape)
x=image.reshape(-1,3) #重造数组
n_colors = 64 #(256,256,256)
model = KMeans(n_colors) #64个聚类
labels = model.fit_predict(x) #每个点的颜色分类,0-63种
colors = model.cluster_centers_ #64个聚类中心,颜色值
new_image=colors[labels]#进行颜色填充
new_image=image.reshape(214,320,3)
new_image=new_image.reshape(image.shape) #还原原来的数组
plt.imshow(image)
plt.show()
plt.imshow(new_image.astype(np.uint8))#转换为数据类型
plt.show()
#查看图片大小
import sys
print('原图片大小:'+str(sys.getsizeof(flower)))
print("压缩后图片大小:"+str(sys.getsizeof(new_image)))
import matplotlib.image as img
img.imsave('image.jpg',flower)
img.imsave('new_image.jpg',new_image)
2. 理解贝叶斯定理:
- M桶:7红3黄
- N桶:1红9黄
- 现在:拿出了一个红球
- 试问:这个红球是M、N桶拿出来的概率分别是多少?
把计算过程与结果拍照发上来。