背景
运营同事发现大量的拼单、淘宝和闲鱼上的会员账号租借服务、外借账号等问题已经影响到了公司营收。为了缓解这种问题,我们决定限制单一账号能够保持登陆状态的设备数量,以此提高租借账号的成本。要想限制设备,首先要解决的问题就是如何识别一台设备。这可以借助FingerprintJS 来解决,然而并不是所有指纹选项都能够投入到生产环境。高熵值的指纹确实可以增加设备的识别率,但却会导致设备指纹频繁变化,从而引起用户频繁掉线,最终影响用户体验。因此我需要解决的第一个问题就是在设备识别率和用户体验之间找到一个熵值的平衡点。我采取的方案是先在各个试点项目中接入计算指纹的逻辑,并不定期给后端发送最新指纹计算结果,后端将这些数据收集起来进行分析,最终在指纹变化频率在可接受范围内找到尽可能多的指纹选项。
数据
每条记录都包含下列字段。
-
指纹(由小写字母和数字组成的32位字符串)
下列32项是从用户浏览器收集到的指纹的名称。每个名称对应表的一个同名字段。如果对这些指纹的计算逻辑有兴趣可以看看我的这篇文章
fonts、domBlockers、fontPreferences、audio、screenFrame、osCpu、languages、colorDepth、deviceMemory、screenResolution、hardwareConcurrency、timezone、sessionStorage、localStorage、indexedDB、openDatabase、cpuClass、platform、plugins、canvas、touchSupport、vendor、vendorFlavors、cookiesEnabled、colorGamut、invertedColors、forcedColors、monochrome、contrast、reducedMotion、hdr、math
-
标记(由小写字母和数字组成的32位字符串):browserMark
-
创建时间(unix):createdAt
-
生成单个指纹所需时间(秒):generateTime
筛选可用指纹
上述的32类指纹不一定每个都符合我们的上线指标,因此要经过筛选。判断一个指纹是否可用需要参考两个指标,这两个指标必须同时合格才能被认定是可用指纹。
「平均变化周期」指标
在这一指标中,我需要观察单个指纹的「平均变化周期」 是否在大多数设备上都能达到可接受的水平。
后端计算
中间变量的计算规则
在计算出最终结果之前会产生一些中间变量,下面列出了这些变量的计算规则。这些计算规则只是为了讲述清楚我希望得到什么样的计算结果,而不是要对计算过程的写法做出的规定。
fcc(指纹变化周期)
依据browserMark对记录分组,同组按照createdAt升序排列。 从头依次遍历组内记录,对每条记录还需依次遍历其全部种类的指纹。对于每一类指纹,都应做如下处理:
用当前记录的指纹比对相同指纹的「上一条记录」,判断两者是否一致。若不一致 则认为此指纹发生了变化。 那么指纹本次的变化周期为当前记录的createdAt减去当前指纹的「上一条记录」的createdAt得到的差值。同时当前记录作为此指纹的「上一条记录」。若一致 则认为指纹没有变化,继续遍历下一条记录。
如果上面这段描述不够清晰,可以结合下面的伪代码来辅助理解:
const allRecord //查询得到的全部记录
const fccCollector = {
}
for (let gi = 0; gi < allRecord.groupCount; gi++) {
const lastRecordMap = {
} //这里存储了各指纹的「上一条记录」
const group = allRecord[gi] //当前分组
for (let