1. 用K-means算做图片压缩
读取一张示例图片或自己准备的图片,观察图片存放数据特点。
根据图片的分辨率,可适当降低分辨率。
再用k均值聚类算法,将图片中所有的颜色值做聚类。
然后用聚类中心的颜色代替原来的颜色值。
形成新的图片。
观察原始图片与新图片所占用内存的大小。
将原始图片与新图片保存成文件,观察文件的大小。
from sklearn.datasets import load_iris
iris=load_iris()
iris.data
from sklearn.datasets import load_sample_image
china=load_sample_image('china.jpg')
print(china.shape)
china
import matplotlib.pyplot as plt
plt.imshow(china,plt.cm.gray)
plt.show()
plt.imshow(china[:,:,0],plt.cm.gray)
plt.show()
from sklearn.datasets import load_sample_image
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import numpy as np
china=load_sample_image('china.jpg')
plt.imshow(china)
plt.show()
image=china[::3,::3]
image.shape
plt.imshow(image)
plt.show()
x=image.reshape(-1,3)
model=KMeans(n_clusters=64)
b=model.fit_predict(x)
a=model.cluster_centers_
a[b]
import sys
sys.getsizeof(china)
sys.getsizeof(image)
import matplotlib.image as img
img.imsave('D://01.jpg',china)
img.imsave('D://02.jpg',image)
2. 理解贝叶斯定理:
- M桶:7红3黄
- N桶:1红9黄
- 现在:拿出了一个红球
- 试问:这个红球是M、N桶拿出来的概率分别是多少?
把计算过程与结果拍照发上来。