from sklearn.datasets import load_sample_image
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
#读取一张示例图片或自己准备的图片,观察图片存放数据特点
china = load_sample_image("china.jpg")
plt.imshow(china)
plt.show()
print(china.shape)
#根据图片的分辨率,适当降低分辨率
image = china[::3,::3] #行列分别按step为3的距离取
x = image.reshape(-1,3) #生成行数自填充,列数为3的二维数组
plt.imshow(image)
plt.show()
print(image.shape,x.shape)
#用k均值聚类算法,将图片中所有颜色值做聚类。
n_color = 64
model = KMeans(n_color)
labels = model.fit_predict(x) #每个点的颜色分类
color = model.cluster_centers_ #64个聚类中心,颜色值
#用聚类中心的颜色代替原来颜色,形成新图片
color[labels]
images = image.reshape(143, 214, 3)
print(images.shape)
plt.imshow(images)
plt.show()
#查看原始图片与新图片所占用内存的大小
import sys
print(sys.getsizeof(china))
print(sys.getsizeof(images))
#将原始图片与新图片保存文件,观察文件大小
import matplotlib.image as img
img.imsave("C:\\china.jpg",china)
img.imsave("C:\\new_china.jpg",images)
1.图片压缩
最后新图片结果如下:
图片大小:
2.贝叶斯
- M桶:7红3黄
- N桶:1红9黄
- 现在:拿出了一个红球
- 试问:这个红球是M、N桶拿出来的概率分别是多少?
解: 设:省略.
1) P(M|A) = P(A·M) · P(M) / P(A) = (7/10 · 1/2)/ (8/20) = 7/8
2) P(N|B) = 1 - P(M|A) = 1/8