所以我一直在研究sklearn和python,试图理解机器学习是如何工作的。我的基本例子是对的,但有一件事我正在努力。在
例如,假设我正在使用digits数据集,一旦我准备好并测试了分类器。在这个例子中,我该如何使用自己手写的图像呢?在
我设法加载了图像并用matplotlib读取了它的像素,但是我从中得到了一个数组(8,8,3),而digits数据集的一个样本的形状是(8,8)。在
这是我用来训练分类器的代码digits = load_digits()
x_train, x_test, y_train, y_test = train_test_split(digits.data, digits.target, test_size=0.20)
clf = svm.SVC(gamma=0.001, C=100)
clf.fit(x_train, y_train)
img = mpimg.imread('handwritten.jpg')
这是我从print(img)得到的打印件
^{pr2}$
这是一个样本数字[ 0. 0. 5. 13. 9. 1. 0. 0. 0. 0. 13. 15. 10. 15. 5.
0. 0. 3. 15. 2. 0. 11. 8. 0. 0. 4. 12. 0. 0. 8.
8. 0. 0. 5. 8. 0. 0. 9. 8. 0. 0. 4. 11. 0. 1.
12. 7. 0. 0. 2. 14. 5. 10. 12. 0. 0. 0. 0. 6. 13.
10. 0. 0. 0.]
正如您所看到的,不仅形状不同,而且特征值也不同,数据集中的样本仅包含0到16的整数,而我的样本具有RGB值。在
那么,如何“规范化”我的数据,以便能够使用我的分类器呢?在