从前我们经常玩找茬游戏,我们用肉眼还是比较容易找出图片中的不同,那在电脑上,计算机是如何分辨两个图片是否相同的呢?下面根据自己的理解来分析一下它的实现过程。
在网上查找资料找到了“图片指纹”这个名词,它的大致意思就是将一个图片的像素点用十六进制的形式来
表示,再根据这种表示形式来比较图片的相似程度。
那该如何计算一张图片的“指纹”呢?
计算“图片指纹”大致需要5个步骤。
1缩放尺寸,将图片规格化。图片的大小可能不同,那它们的尺寸就有可能对计算结果造成影响,所以先将
它们缩放成我们自己规定的大小,这样比较起来也会比较方便。
2简化色彩。我们现在要比较的实际上是图片的像素,那不同的色彩以及明亮度同样会对结果造成影响,所以
我们要简化它的色彩。
3计算图片的像素平均值。这一步主要是为了下面步骤。
4比较像素的灰度值与平均值,如果大于平均值,记为1,否则为0。
5算出“指纹”。
下面是实现代码:
/**
* 生成图片指纹
* @param filename 文件名
* @return 图片指纹
*/
public static String produceFingerPrint(String filename) {
BufferedImage source = ImageHelper.readPNGImage(filename);// 读取文件
int width = 8;
int height = 8;
// 第一步,缩小尺寸。
// 将图片缩小到8x8的尺寸,总共64个像素。这一步的作用是去除图片的细节,只保留结构、明暗等基本信息,摒弃不同尺寸、比例带来的图片差异。
BufferedImage thumb = ImageHelper.thumb(source, width, height, false);
// 第二步,简化色彩。
// 将缩小后的图片,转为64级灰度。也就是说,所有像素点总共只有64种颜色。
int[] pixels = new int[width * height];
for (int i = 0; i < width; i++) {
for (int j = 0; j < height; j++) {
pixels[i * height + j] = ImageHelper.rgbToGray(thumb.getRGB(i, j));
}
}
// 第三步,计算平均值。
// 计算所有64个像素的灰度平均值。
int avgPixel = ImageHelper.average(pixels);
// 第四步,比较像素的灰度。
// 将每个像素的灰度,与平均值进行比较。大于或等于平均值,记为1;小于平均值,记为0。
int[] comps = new int[width * height];
for (int i = 0; i < comps.length; i++) {
if (pixels[i] >= avgPixel) {
comps[i] = 1;
} else {
comps[i] = 0;
}
}
// 第五步,计算哈希值。
// 将上一步的比较结果,组合在一起,就构成了一个64位的整数,这就是这张图片的指纹。组合的次序并不重要,只要保证所有图片都采用同样次序就行了。
StringBuffer hashCode = new StringBuffer();
for (int i = 0; i < comps.length; i+= 4) {
int result = comps[i] * (int) Math.pow(2, 3) + comps[i + 1] * (int) Math.pow(2, 2) + comps[i + 2] * (int) Math.pow(2, 1) + comps[i + 3];
hashCode.append(binaryToHex(result));
}
// 得到指纹以后,就可以对比不同的图片,看看64位中有多少位是不一样的。
return hashCode.toString();
}
然后是将要比较的图片与原图片进行比较,如果“图片指纹”相差到一定程度,则认为两张图片是不同的,否
则相同。
/**
* 计算"距离"。
* 如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片。
* @param sourceHashCode 源hashCode
* @param hashCode 与之比较的hashCode
*/
public static int hammingDistance(String sourceHashCode, String hashCode) {
int difference = 0;
int len = sourceHashCode.length();
for (int i = 0; i < len; i++) {
if (sourceHashCode.charAt(i) != hashCode.charAt(i)) {
difference ++;
}
}
return difference;
}
下面是ImageHelper中的一些方法:
/**
* 读取JPEG图片
* @param filename 文件名
* @return BufferedImage 图片对象
*/
public static BufferedImage readPNGImage(String filename)
{
try {
File inputFile = new File(filename);
BufferedImage sourceImage = ImageIO.read(inputFile);
return sourceImage;
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (ImageFormatException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
return null;
}
/**
* 灰度值计算
* @param pixels 像素
* @return int 灰度值
*/
public static int rgbToGray(int pixels) {
// int _alpha = (pixels >> 24) & 0xFF;
int _red = (pixels >> 16) & 0xFF;
int _green = (pixels >> 8) & 0xFF;
int _blue = (pixels) & 0xFF;
return (int) (0.3 * _red + 0.59 * _green + 0.11 * _blue);
}
/**
* 计算数组的平均值
* @param pixels 数组
* @return int 平均值
*/
public static int average(int[] pixels) {
float m = 0;
for (int i = 0; i < pixels.length; ++i) {
m += pixels[i];
}
m = m / pixels.length;
return (int) m;
}
这样比较出来的图片是有一定局限的,对于两张只有大小,明亮程度有差别的图片它才会认为是相同的,而
对于两张只有一小部分有文字之外,其他都相同的图片,它会认为不同。但如果我们对其中的参数进行改变的话还是可以使它有所改进的。但那样的话或许会导致匹配的精度下降甚至出现错误,但我们还是能用这种方法做一个自动帮你找茬的这样一个工具的。