微信好友列表和小程序授权获取的用户数据的对应问题

本文链接：https://blog.csdn.net/xq7801821/article/details/114984669

本文介绍了一种基于头像相似度的匹配算法，旨在解决微信小程序用户与运营人员好友列表间的匹配问题。通过AHash、DHash及PHash三种哈希算法对比头像，实现了高效的匹配。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目前很多公司都会在微信上进行运营，公司的系统是独立系统，有自己的账号体系，微信也可以登录自己的系统

如果自己的系统并没有是通过手机号注册的账号的情况下，用户使用微信上登录系统并购买，运营人员加用户微信进行销售和介绍

就需要一个方法将小程序的登录用户和运营好友列表进行对应，方便运营人员查看好友中哪些人买了哪些东西，在系统中的账号是谁。

但是，在拿到用户微信上的好友列表数据和小程序授权收拿到的用户数据之后，发现这两中渠道的数据无法对应谁是谁。

通过两种渠道获取的数据内容分别是：

（1）微信好友列表拿到的数据包括：头像、昵称、微信号、地区、性别

（2）小程序授权拿到的数据包括：头像、昵称、openId、地区、性别，手机号（需要二次授权获取）

微信没有能直接将两者联系上的唯一字段。

从前言的描述来看，已经无法通过唯一键来进行账号和微信之间的对应，所以需要别的办法

目前业界普遍的办法就是通过进行头像、昵称、地区、性别等进行数据对比，猜测人和人的对应关系

这里最重要的对比项就是头像的相似度对比，那么下面就进行头像的对比方法算法阐述。

目前主流的比较图片相似度的算法总共有以下几种大类：关键点匹配，直方图统计，哈希算法（Hash）等等，

关键点匹配等方法考虑到在java语言角度且依赖OpenCV等，该算法的适用面且此类算法过于复杂。

目前仅需要对小程序和微信好友进行头像对比相似度，那么直方图和Hash算法是比较简单、快速易用的算法。

且哈希算法可以对同一图片的不同尺寸有着比较良好的比较效果，故考虑使用哈希算法进行图片的相似度比较。

图片相似度的几种哈希算法目的都是为了将图片生成一个“指纹”（使用0和1组成的64位字符串），用于区分每一张图片，

那么比较两个指纹的差异，也就是为了比较字符的距离，有三种方法：欧几里得距离，余弦相似度，汉明距离。其中汉明距离是最快最简单的距离计算方法。

平均哈希算法是三种Hash算法中最简单的一种，它通过下面几个步骤来获得图片的Hash值，这几个步骤分别是

(1) 缩放图片8*8；

(2) 转灰度图;

(3) 算像素均值；

(4)根据相似均值计算指纹。具体算法如下所示:

步骤	具体内容
步骤	具体内容
缩放图片	输入图片大小尺寸各异，为了统一图片的输入，统一将图片尺寸缩放为8*8，一共得到了64个像素点。
转灰度图	输入图片有些为单通道灰度图，有些RGB三通道彩色图，有些为RGBA四通道彩色图。也为了统一下一步输入标准，将非单通道图片都转为单通道灰度图。其中RGB三通道转单通道算法有下面几种: 1.浮点算法：Gray=R0.3+G0.59+B0.11 2.整数方法：Gray=(R30+G59+B11)/100 3.移位方法：Gray =(R76+G151+B*28)>>8; 4.平均值法：Gray=（R+G+B）/3; 5.仅取绿色：Gray=G；
算像素均值	通过上一步可得一个8x8的整数矩阵G，计算这个矩阵中所有元素的平均值，假设其值为a
据像素均值计算指纹	初始化输入图片的ahash = "" 从左到右一行一行地遍历矩阵G每一个像素如果第i行j列元素G(i,j) >= a，则ahash += "1"如果第i行j列元素G(i,j) <a，则ahash += "0"

感知哈希算法是三种Hash算法中较为复杂的一种，它是基于DCT（离散余弦变换）来得到图片的hash值，其算法几个步骤分别是

(1) 缩放图片32*32；

(2) 转灰度图;

(3) 计算DCT；

(4) 缩小DCT;

(5) 算平均值；

(6) 计算指纹。具体算法如下所示:

步骤	具体内容
缩放图片	统一将图片尺寸缩放为32*32，一共得到了1024个像素点。
转灰度图	统一下一步输入标准，将非单通道图片都转为单通道灰度图。
计算DCT	计算32x32数据矩阵的离散余弦变换后对应的32x32数据矩阵
缩小DCT	取上一步得到32x32数据矩阵左上角8x8子区域
算平均值	通过上一步可得一个8x8的整数矩阵G, 计算这个矩阵中所有元素的平均值，假设其值为a
计算指纹	初始化输入图片的phash = "" 从左到右一行一行地遍历矩阵G每一个像素如果第i行j列元素G(i,j) >= a，则phash += "1" 如果第i行j列元素G(i,j) <a，则phash += "0"

相比pHash，dHash的速度要快的多，相比aHash，dHash在效率几乎相同的情况下的效果要更好，它是基于渐变实现的。其算法几个步骤分别是

(1) 缩放图片9*8；

(2) 转灰度图;

(3) 算差异值；
(4) 计算指纹。具体算法如下所示

步骤	具体内容
小图片	统一将图片尺寸缩放为9x8，一共得到了72个像素点
转灰度图	统一下一步输入标准，将非单通道图片都转为单通道灰度图。
算差异值	当前行像素值-前一行像素值，从第二到第九行共8行，又因为矩阵有8列，所以得到一个8x8差分矩阵G
计算指纹	初始化输入图片的dhash = "" 从左到右一行一行地遍历矩阵G每一个像素如果第i行j列元素G(i,j) >= a，则dhash += "1" 如果第i行j列元素G(i,j) <a，则dhash += "0"