前面学习了使用kNN来识别手写数字,在这里将来学习使用kNN识别手写字母。同前面一样,首先要构造训练数据,那么训练数据来自哪里呢?如果没有网络,还得自己一个一个地构造,幸好有网络帮忙,直接到下载一个即可。下载文件letter-recognition.data,接着用编辑器打开,一看到内容如下:
T,2,8,3,5,1,8,13,0,6,6,10,8,0,8,0,8
I,5,12,3,7,2,10,5,5,4,13,3,9,2,8,4,10
D,4,11,6,8,6,10,6,2,6,10,3,7,3,7,3,9
N,7,11,6,6,3,5,9,4,6,4,4,10,6,10,2,8
G,2,1,3,1,1,8,6,6,6,6,5,9,1,7,5,10
看不懂吧,像一堆垃圾数据一样,难道真有科学家这么闲,去构造一堆垃圾出来吗?显然不可能的,那么我们那里不对呢?可能是我们的想法与科学家不一样,也就是思路不一样,那么怎么样才能站在科学家的思路上呢?方法是有的,