OCR应用非常广泛,而且有许多方法,今天用KNN算法实现简单的0-9手写数字识别。本程序使用OpenCV 3.0和Python 3。
KNN算法是K近邻分类算法,属于机器学习中的监督学习,需要一定量的带标签的输入样本数据进行“训练”,然后就可以识别。我给“训练”打引号是因为其实KNN没有明显的前期训练过程,它是要给一个样本x分类,就从数据集中在x附近找离它最近的k各数据点,这k个数据点中包含的y类别最多,那么就把x的标签标记为y,这就完成了分类识别的过程。
首先,利用OpenCV自带的手写数字样本集digits.png来进行初始训练:
def initKnn():
knn = cv2.ml.KNearest_create()
img = cv2.imread('digits.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cells = [np.hsplit(row,100) for row in np.vsplit(gray,50)]
train = np.array(cells).reshape(-1,400).astype(np.float32)
trainLabel = np.repeat(n