原来自己统计的设备数,用IMEI和MAC地址全不准

先说下IMEI和MAC


IMEI码由GSM(Global System for Mobile Communications,全球移动通信协会)统一分配,授权BABT(British approvals Board of Telecommunications,英国通信认证管理委员会)审受。

IMEI由15位数字组成,每位数字仅使用0~9的数字,其组成为:
1、前6位数(TAC,Type Approval Code)是“型号核准号码”,一般代表机型。
2、接着的2位数(FAC,Final Assembly Code)是“最后装配号”,一般代表 产地
3、之后的6位数(SNR,Serial Number,出厂序号)是“串号”,一般代表生产顺序号。
4、最后1位数(SP)通常是“0”,为检验码,备用。
IMEI码具有唯一性,贴在手机背面的标志上,并且读写于手机内存中。它也是该手机在厂家的“档案”和“身份证号”。
如:SUMSUNG的一台GT-I9308手机的IMEI是:355065 05 331100 1/01。其中,355065是TAC,05是FAC,331100是SNR,1是SP,01是软件版本号。
MAC(Media Access Control或者Medium Access Control)地址,意译为媒体访问控制,或称为物理地址、硬件地址,用来定义 网络设备 的位置。在 OSI模型 中,第三层 网络层 负责  IP地址 ,第二层数据链路层则负责 MAC地址。因此一个主机会有一个MAC地址,而每个 网络位置 会有一个专属于它的IP地址。我们有时候也误将它们当做是手机的物理地址。
为什么说它们不准呢?


大多数移动统计的 ID 都是通过系统 ID 生成的,包括但不限于 IMEI、MAC、Android ID。最著名的 ID 莫过于 UDID, 迫于隐私的压力,苹果最终废弃了 UDID 和 MAC 地址。

大多数网站统计都是基于 Cookie的,因此是暂态ID(Temporal ID)。OpenUDID 就是一个典型的暂态ID。

苹果的 IDFA 和 IDFV 都是系统ID,但是他们同时也是暂态ID。


2. ID质量

进行可区分统计的基础是确立一个可靠的身份标识符,这看上去是一个很简单的事情,只需要选择一个ID,或者人为构造一个类Cookie ID,就可以完成独立用户量、留存等分析。但遗憾的是,除了苹果已经废除的UDID,几乎没有一个接近完美的ID。

为了方便讨论,首先忽略假数据的存在,假设每个设备都有一个真实的身份标识X。可区分统计的目标是选择一个合适的身份标识I,使得基于I的统计结果尽可能地和 X 一致。

首先,我们引入两个概念ID冲突(Collision)和ID漂移(Jitter)。

ID冲突

对于某个设备集合(Device Cohort),在某个时间段内,总是可以测量 X 和 I 的数量,用 Count(X) 和 Count (I) 来表示。如果在足够短的时间内



1

Count(X) > Count(I)



我们称 I 是一个存在冲突的 ID。

ID漂移

对于某个设备集合(Device Cohort),在某个时间段内,总是可以测量 X 和 I 的数量,用 Count(X) 和 Count (I) 来表示。如果在足够长的时间内



[Java] 纯文本查看 复制代码

?

1

Count(X) < Count(I)



则我们称 I 是一个存在漂移的 ID。

Android 设备的IMEI 就是一个存在严重冲突的 ID,根据我们的估算,其冲突率大于 3%。这是因为很多山寨机的IMEI 是相同的。

Android 设备的 MAC 也是一个存在冲突的ID,因为很多山寨机的MAC也是相同的。此外,MAC还是一个典型的存在严重漂移的 ID,这是因为 Android 的源代码中有一段随机生成MAC  地址后24位的代码被滥用了

定性分析

接下来,我们可以定性分析一下ID冲突和漂移对统计数据的影响:

当一个ID仅存在冲突的时候,利用这个ID统计的DAU和安装都会被低估,但是有可能会高估留存。但是这些影响都是温和的,例如5% 的ID冲突仅仅会导致DAU至多被低估 5%,而对留存的影响几乎可以忽略。

当一个ID仅存在漂移的时候,利用这个ID统计的DAU和安装都会被高估,同时会影响留存。当漂移较大的时候,对统计指标的影响是剧烈的。例如,一个每日漂移为5%的ID,可能会造成DAU被高估2%,但是会每天造成5%的虚假安装(这是因为漂移会影响所有用户,包括不活跃用户),同时这些虚假安装的留存在短期内偏高,但是长期留存则偏低(短期内没有漂移的时候就会偏高,时间长了,漂移了就会偏低)。任何类Cookie的ID都会有类似的性质,因此传统的网站统计正在全面转向更为可靠的设备指纹。

当一个ID既存在冲突又存在漂移的时候,利用这个ID统计出来的DAU和安装是完全不可靠的。以MAC地址为例,存在漂移的这部分设备的MAC地址会频繁变化,因此会制造大量的虚假安装,同时留存率非常低。对于用户量不大的应用而言,选择存在这类ID的后果是灾难性的。

综上所述,当ID的漂移和冲突足够小的时候,他们对可区分统计的影响都是可以忽略的。当这些误差不可忽略的时候,ID的冲突造成的影响是温和的,而ID的漂移则会严重干扰安装和留存统计。


Android平台

对于Android平台,由于系统生态的开放性,ID的选择也一直是一个头疼的问题。

(1)单一ID

如前文所述,IMEI和MAC都不是最好的ID。特别是MAC地址,几乎是一个不可用的ID。

(2)组合ID

有些开发者会选择使用多个ID合并成一个组合ID,例如


1

CID = MD5( imei+mac+android_id)



利用前面的分析不难得出,组合ID将会极大地降低冲突,但是会放大漂移。对于组合ID而言,任何一个源ID的漂移都会造成它的漂移。

开发者应该尽量避免CID,一定要使用也需要避免使用MAC地址。如果已经在使用CID,那么请确保在下一个版本把CID当作一个Cookie ID持久化,只有在Cookie丢失的情况下才重新生成CID。这样的策略可以尽量保证ID的延续性,同时缓解漂移造成的影响。


  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
获取安卓设备IMEIMac地址需要使用Android NDK来编写C++代码,因为IMEIMac地址是由操作系统提供的,而操作系统是用Java或者Kotlin编写的。以下是获取IMEIMac地址的示例代码: ```c++ #include <jni.h> #include <android/log.h> #include <string> #include <sstream> using namespace std; extern "C" { JNIEXPORT jstring JNICALL Java_com_example_android_deviceinfo_DeviceInfoActivity_getIMEI(JNIEnv *env, jobject instance) { jclass clazz = env->FindClass("android/telephony/TelephonyManager"); jmethodID getIMEIMethod = env->GetMethodID(clazz, "getDeviceId", "()Ljava/lang/String;"); jobject telephonyManager = env->CallObjectMethod(instance, env->GetMethodID(env->GetObjectClass(instance), "getSystemService", "(Ljava/lang/String;)Ljava/lang/Object;"), env->NewStringUTF("phone")); jstring imei = (jstring) env->CallObjectMethod(telephonyManager, getIMEIMethod); const char *imeiChars = env->GetStringUTFChars(imei, NULL); string result = string(imeiChars); env->ReleaseStringUTFChars(imei, imeiChars); return env->NewStringUTF(result.c_str()); } JNIEXPORT jstring JNICALL Java_com_example_android_deviceinfo_DeviceInfoActivity_getMacAddress(JNIEnv *env, jobject instance) { jclass clazz = env->FindClass("java/net/NetworkInterface"); jmethodID getHardwareAddressMethod = env->GetMethodID(clazz, "getHardwareAddress", "()[B"); jclass inetAddressClazz = env->FindClass("java/net/InetAddress"); jmethodID getByAddressMethod = env->GetStaticMethodID(inetAddressClazz, "getByAddress", "([B)Ljava/net/InetAddress;"); jobjectArray networkInterfaces = (jobjectArray) env->CallStaticObjectMethod(clazz, env->GetStaticMethodID(clazz, "getNetworkInterfaces", "()Ljava/util/Enumeration;")); jstring result = env->NewStringUTF(""); while (env->CallBooleanMethod(env->CallObjectMethod(networkInterfaces, env->GetMethodID(env->FindClass("java/util/Enumeration"), "hasMoreElements", "()Z")), env->GetMethodID(env->FindClass("java/util/Enumeration"), "nextElement", "()Ljava/lang/Object;"))) { jobject networkInterface = env->CallObjectMethod(networkInterfaces, env->GetMethodID(env->FindClass("java/util/Enumeration"), "nextElement", "()Ljava/lang/Object;")); jbyteArray hardwareAddress = (jbyteArray) env->CallObjectMethod(networkInterface, getHardwareAddressMethod); if (hardwareAddress == NULL) { continue; } jbyte *hardwareAddressBytes = env->GetByteArrayElements(hardwareAddress, NULL); jint hardwareAddressLength = env->GetArrayLength(hardwareAddress); stringstream ss; for (int i = 0; i < hardwareAddressLength; i++) { ss << hex << (int) hardwareAddressBytes[i]; if (i != hardwareAddressLength - 1) { ss << ":"; } } string macAddress = ss.str(); if (macAddress != "") { result = env->NewStringUTF(macAddress.c_str()); break; } } return result; } } ``` 在Java代码中,需要声明native方法,并且使用System.loadLibrary来加载C++库。以下是在Java代码中调用上面定义的native方法的示例代码: ```java public class DeviceInfoActivity extends AppCompatActivity { static { System.loadLibrary("deviceinfo"); } @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout.activity_device_info); String imei = getIMEI(); String macAddress = getMacAddress(); TextView imeiTextView = findViewById(R.id.imeiTextView); imeiTextView.setText(imei); TextView macAddressTextView = findViewById(R.id.macAddressTextView); macAddressTextView.setText(macAddress); } public native String getIMEI(); public native String getMacAddress(); } ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值