欧氏距离
在数学中,欧几里得距离或欧几里得度量是欧几里得空间中两点间“普通”(即直线)距离。使用这个距离,欧氏空间成为度量空间。相关联的范数称为欧几里得范数。较早的文献称之为毕达哥拉斯度量。–维基百科
在欧几里得空间中,点x =(x1,…,xn)和 y =(y1,…,yn)之间的欧氏距离为
在欧几里得度量下,两点之间线段最短。
思路
- 数据集图片与手写数字图片格式化
- 转换为 X × Y X\times Y X×Y 大小(缩小,消除细节)
- 灰度化,只保留结构、明暗等基本信息
- 识别
部分代码
格式化转换
这里用到的代码与之前我所写的相似图片搜索类似,在那一篇内已经较详细讲解,此处不再赘述。
识别
计算欧氏距离:(此处我没有严格使用欧式距离,因为我所计算出的值不大,因此这样能保持更多的信息)
private double compareImage(int[] source, int[] pixels){
double count = 0;
for(int i=0;i< source.length;i++){
count += Math.pow((source[i]-pixels[i]),2);
}
return count;
}
存储距离,用HashMap(标签,距离列表)存储:
for (int i = 0; i < exampleHashCodesZero.size(); i++) {
double difference = compareImage(detectImage, exampleHashCodesZero.get(i));
arrayList0.add((difference));
hashMap.put("0",arrayList0);
}
全部计算完全以后,从HashMap中取出最小距离对应的key(标签):
HashMap resultHashMap = new HashMap();
resultHashMap.put("0",Collections.min(hashMap.get("0")));
List<Map.Entry<String, Double>> list = new ArrayList(resultHashMap.entrySet());
Collections.sort(list, (o1, o2) -> (int) (o1.getValue() - o2.getValue()));
彩蛋
数据集:MNIST手写识别数据集
提取idx中的图片:读取Java中的IDX文件类型
图片分类:我将0-9十个数字对应的图片分别存在一个文件夹内,最初采用的是在win10资源管理器中移动,结果界面不断卡死。之后我在powershell中使用mv命令,速度快,无卡顿。将以0开头的png文件移动至桌面的abc文件夹中,如下:
mv 0*.png C:\Users\77509\Desktop\abc\