java knn opencv_OpenCV闯关记——kNN算法在OpenCV中的实践

什么是kNN算法

邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。

kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 kNN方法在类别决策时,只与极少量的相邻样本有关。由于kNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,kNN方法较其他方法更为适合。

环境准备

pip install numpy

# 在国内往往会安装失败,如果安装失败,可通过先wget xxx.whl在运行pip install解决

# 比如:

wget https://pypi.python.org/packages/5e/d5/3433e015f3e4a1f309dbb110e8557947f68887fe9b8438d50a4b7790a954/numpy-1.11.2-cp27-cp27mu-manylinux1_x86_64.whl#md5=fa62a11922a9e0776963508fb5254d3d

pip install numpy-1.11.2-cp27-cp27mu-manylinux1_x86_64.whl

安装matplotlib,matplotlib是什么

pip install matplotlib

# 如安装失败的话,解决办法参考安装numpy的解决办法

Coding

# encoding: utf-8

import cv2

import numpy as np

import matplotlib.pyplot as plt

train_data = np.random.randint(0, 100, (25, 2)).astype(np.float32)

responses = np.random.randint(0, 2, (25, 1)).astype(np.float32)

red = train_data[responses.ravel() == 0]

plt.scatter(red[:,0], red[:,1], 80, 'r', '^')

blue = train_data[responses.ravel() == 1]

plt.scatter(blue[:,0], blue[:,1], 80, 'b', 's')

# plt.show()

newcomer = np.random.randint(0, 100, (1, 2)).astype(np.float32)

plt.scatter(newcomer[:,0], newcomer[:,1], 80, 'g', 'o')

knn = cv2.ml.KNearest_create()

knn.train(train_data, cv2.ml.ROW_SAMPLE, responses)

ret, results, neighbours, dist = knn.findNearest(newcomer, 5)

print("result: ", results)

print("neighbours: ", neighbours)

print("distance: ", dist)

plt.show()

运行结果

fb12370d59b0a4fc46b973092a2b89a0.png

代码解释

生成待训练的数据和标签

train_data = np.random.randint(0, 100, (25, 2)).astype(np.float32)

responses = np.random.randint(0, 2, (25, 1)).astype(np.float32)

在图中标记红色样本

red = train_data[responses.ravel() == 0]

plt.scatter(red[:,0], red[:,1], 80, 'r', '^')

在图中标记蓝色样本

blue = train_data[responses.ravel() == 1]

plt.scatter(blue[:,0], blue[:,1], 80, 'b', 's')

产生待分类数据

newcomer = np.random.randint(0, 100, (1, 2)).astype(np.float32)

plt.scatter(newcomer[:,0], newcomer[:,1], 80, 'g', 'o')

训练样本并产生分类

knn = cv2.ml.KNearest_create()

knn.train(train_data, cv2.ml.ROW_SAMPLE, responses)

给新数据分类

ret, results, neighbours, dist = knn.findNearest(newcomer, 5)

在图中显示所有数据

plt.show()

Referer

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值