OpenCV中的Resize和Reshape

本文探讨了OpenCV中的Resize和Reshape两个函数,重点解析它们在改变矩阵形状时的不同点。Mat::reshape仅逻辑上改变矩阵的通道和行数,不涉及数据复制,要求矩阵连续;Mat::resize会改变矩阵行数,导致内存重新分配;cv::resize通过插值方法调整图像尺寸,适用于uchar、float和double类型,但不支持int类型元素。
摘要由CSDN通过智能技术生成

OpenCV中的Resize和Reshape都是改变一个矩阵的形状,那它们有哪些不同点呢?

1. Mat::reshape( ) 

只是在逻辑上改变矩阵的行列数或者通道数,没有任何的数据的复制,也不会增减任何数据,因此这是一个O(1)的操作,它要求矩阵是连续的。

C++: Mat Mat::reshape(int cn, int rows=0 const)

cn:目标通道数,如果是0则保持和原通道数一致;

rows:目标行数,同上是0则保持不变;

改变后的矩阵要满足 rows*cols*channels

### 回答1: 好的,以下是基于OpenCV和KNN的简单数字识别代码,供您参考: ``` import cv2 import numpy as np def get_image_contours(image): gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) blur = cv2.GaussianBlur(gray, (5, 5), 0) _, thresh = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU) contours, _ = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) return contours def extract_digit(image, contour, size): x, y, w, h = cv2.boundingRect(contour) if w*h == 0: return None roi = np.zeros((28, 28), np.uint8) maxdim = max(w, h) roi[y:y+maxdim, x:x+maxdim] = cv2.resize(image[y:y+maxdim, x:x+maxdim], (maxdim, maxdim)) roi = cv2.copyMakeBorder(roi, 2, 2, 2, 2, cv2.BORDER_CONSTANT, (0,0,0)) roi = cv2.resize(roi, size, interpolation=cv2.INTER_AREA) return roi.reshape((1, size[0] * size[1])) def train_knn(digits, labels): knn = cv2.ml.KNearest_create() knn.train(digits, cv2.ml.ROW_SAMPLE, labels) return knn def main(): digits = cv2.imread("digits.png", cv2.IMREAD_GRAYSCALE) digits = cv2.resize(digits, (1000, 2000)) contours = get_image_contours(digits) knn_digits = [] knn_labels = [] size = (28, 28) for contour in contours: digit = extract_digit(digits, contour, size) if digit is not None: knn_digits.append(digit) knn_labels.append(int(cv2.boundingRect(contour)[0] / 50)) knn_digits = np.array(knn_digits) knn_labels = np.array(knn_labels) knn = train_knn(knn_digits, knn_labels) test_digits = cv2.imread("test_digits.png", cv2.IMREAD_GRAYSCALE) test_digits = cv2.resize(test_digits, (1000, 2000)) test_contours = get_image_contours(test_digits) for contour in test_contours: digit = extract_digit(test_digits, contour, size) if digit is not None: _, result, _, _ = knn.findNearest(digit, k=5) print(int(result[0][0])) if __name__ == "__main__": main() ``` 这个代码可以读取数字图片并使用KNN算法进行识别。请确保已经准备好数字图片和测试数字图片,在代码指定正确的路径。 ### 回答2: 基于OpenCV和KNN的简单数字识别代码是通过使用OpenCV的图像处理和机器学习算法来训练一个K最近邻(KNN)分类器。 首先,我们需要准备一组带有标签的数字图像数据集作为训练数据。可以使用MNIST数据集或自己创建一个。每个图像应该具有与之对应的标签或类别。 接下来,我们通过对每个图像进行预处理来提取其特征。可以使用OpenCV的一些图像处理方法,如灰度化、二值化、轮廓提取等。将处理后的图像表示为特征向量。 然后,我们使用特征向量和对应的标签来训练KNN分类器。KNN算法根据最近邻的样本来预测未知样本的类别。可以使用OpenCV的ml模块来实现KNN分类器的训练。 完成训练后,我们可以使用KNN分类器来对新的数字图像进行识别。通过对新图像进行相同的预处理步骤来提取特征,并使用KNN算法预测它的类别。最终输出识别结果。 整个过程需要导入OpenCV的相关库,进行数据集的预处理和特征提取,以及训练和预测KNN分类器的代码实现。 这种基于OpenCV和KNN的简单数字识别代码,虽然简单,但是具有一定的准确性和可靠性。可以通过增加训练数据集的规模、改进特征提取方法和调整KNN算法的参数等方式进一步提高识别的准确率。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值