视觉机器学习1(补)——Kmeans

OpenCV是一个开源的视觉库,里面也封装了机器学习的相关库。下面介绍用OpenCV实现Kmeans。

OpenCV中使用cv.kmeans()函数进行数据聚类。

-输入参数:
1. 样本:它应该是np.float32数据类型,并且每个要素应放在一个列中
2. n群(K):最后需要的群集数
3. 标准:这是迭代终止标准。当满足这个标准时,算法迭代停止。实际上,它应该是3个参数的元组。他们是’(type, max_iter,epsilon)`:a. 终止标准的类型。它有3个标志如下:
cv.TERM_CRITERIA_EPS - 如果达到指定的精度epsilon,则停止算法迭代。
cv.TERM_CRITERIA_MAX_ITER - 在指定的迭代次数max_iter之后停止算法。
cv.TERM_CRITERIA_EPS + cv.TERM_CRITERIA_MAX_ITER - 当满足上述任何条件时停止迭代。
b: max_iter - 指定最大迭代次数的整数。
c: epsilon - 所需的准确性
4. 企图:标志指定使用不同的初始标签执行算法的次数。该算法返回产生最佳紧凑性的标签。这种紧凑性作为输出返回。
5. 标志:该标志用于指定如何初始中心。通常使用两个标志:cv.KMEANS_PP_CENTERS和cv.KMEANS_RANDOM_CENTERS。

-输出参数

  1. 紧凑性:它是从每个点到相应中心的平方距离的总和。
  2. 标签:这是标签数组(与前一篇文章中的’代码’相同),其中每个元素标记为’0’,’1’…..
  3. 中心:这是一组中心。

    官方文档讲了俩个例子,一个是T恤的问题,这个略过不谈。这里只讲用Kmeans将图片分割的实现。

彩图有三个特征,比如说:RGB。所以先将图片重塑为一个M×3的数组。比如说我读取的图片是500×614的分辨率,所以它读取后的矩阵大小是(500,614,3),转化后为(307000,3)大小了。聚类之后,我们将质心值(它也是R,G,B)应用于所有像素,以便生成的图像具有指定数量的颜色。再次,我们需要将它重新塑造成原始图像的形状。以下是代码:

import numpy as np
import cv2

img = cv2.imread('01.jpg')
#转为M×3大小
Z = img.reshape((-1,3))
print(Z.shape)
# convert to np.float32
Z = np.float32(Z)

# define criteria, number of clusters(K) and apply kmeans()
criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 10, 1.0)
K = 4
ret,label,center=cv2.kmeans(Z,K,None,criteria,10,cv2.KMEANS_RANDOM_CENTERS)

# Now convert back into uint8, and make original image
center = np.uint8(center)
res = center[label.flatten()]
res2 = res.reshape((img.shape))

cv2.imshow('res2',res2)
cv2.waitKey(0)
cv2.destroyAllWindows()

再看看效果:
这里写图片描述

这里写图片描述

https://docs.opencv.org/3.4.1/d1/d5c/tutorial_py_kmeans_opencv.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值