这是一个重复着昨天的故事:
昨日,一位分析师小姐姐焦急地问我:“僧哥僧哥,我使用了你们提供的数据服务,为什么设备ID都匹配不上,但之前是能匹配上的。你们最近有没有更新数据,会不会存在什么问题?客户着急要分析结果,请尽快支持一下哈~~”
“你输入的数据是哪来的?”,我问道。
“客户提供的。” 注:如果不是稳定的数据来源(如:接口),出问题的可能性会比较大。
“这次的数据和上次是同一批吗?”
“不是......” 注:干扰因素太多,无法定论。
“客户传的ID是什么?”
“IDFA” 注:IDFA容易出现明文大小写及是否带减号的GAP。
“客户提供的ID加密方式,都对吗?”
“对的,我确认过了,都是32位 md5加密的,没有问题。” 即使看起来是md5,但也可能受加密前格式及是否加盐等因素影响。
“我看要不这样,这种问题大概率是客户提供的ID有问题,或者与咱们数据id的加密方式不一致。要不你先分析一下,我告诉你分析方法,以后遇到类似的事情也能有更大的掌控度。如果你最终还是搞不定或者能够证明我的数据大概率有问题,我再帮你深入分析吧。这样效率会高一些。” 我心想:“授人以鱼不如授人以渔,同时也得安抚一下对方,不能让对方误以为我一个不愿担当的仔。”
“好呀好呀,麻烦告诉我分析的方法~~” 看来小姐姐还是比较通情达理的。
“首先,我们可以通过权威的第三方平台验证最新批次的id包的准确性,这样比较直接。你有D***bank或者**dmp的账号吗?”
“没有呢......”
“也那也不要紧,你可以用之前的包,重新匹配一遍,如果能匹配上,则说明我的数据没有问题,进而可以判断,客户最新提供的ID大概率是有问题的,你就可以与客户确认了。遇到什么新的问题,也可以随时找我。”
“好的好的,我分析一下”
经确认,的确是客户传的数据有问题,完美解决!
这其实是个简单的问题,但是有些小伙伴往往会理不清思路。总结下来有几点建议:
1、在不惊动客户的前提下,确认已有信息,判断是否存在明显问题。
2、个人应对数据问题有基本的分析,排除己方的失误,影响结论的准确性。
3、如果有第3方权威平台,可以直接用于ID准确性验证。
4、如果没有第3方权威平台,可以排除干扰因素,先使用旧包验证数据服务本身是否存在问题。