伍拾叁- 基于大数据的会员识别基础 - 泛会员识别体系

一、会员系统演变

1.1) 什么是会员

如何识别客户,是企业对客户运营的重点主题之一。
以某咖啡店的会员体系为例:

  • 最早是以 会员卡 作为单个会员的识别
  • 然后以 电邮 为单个会员的识别
  • 最后是以 手机号码 为单个会员的识别

但在电子支付的流行、社交软件的兴起,以及更深入的用户画像分析需求下,如何更主动的识别会员、更全面的分析会员行为成为了重点的课题。

1.2) 泛会员

是否曾有一种经验,刚计划去旅游时,飞猪就马上自动推荐目的地的旅游景点,淘宝自动推荐目的地的特产,神州租车告诉你目的机场 / 火车站的自驾取车点,Airbnb 马上告诉你目的地的民宿,大众点评 马上推荐当地的网红打卡点信息给你。
而这一切都不是你自己去主动查找的,你仅仅是被某些搜索平台告诉各公司你的小心思,以及你的某些信息,而各企业就自动会根据得到的信息迫不及待的告诉你们他们能在你这个小心思之中,怎么去赚你的钱为你提供服务 。

二、分析会员行为的意义

您是否有遇过相似的问题?

  1. 举行完一场促销活动想知道是否有效果
  2. 更换了线下实体店铺装修后想知道客户是否乐意接受
  3. 企划新产品时,是否能直接从品牌的原客户引流
  4. 通过何种方法对客户进行最有效的接触

如果没有办法串起一个客户所产生的所有记录,我们连上述一个问题都无法解答。

三、大数据不是大量数据-数据示例

如果数据来源单一,单纯是数据量级很大,是不构成 大数据 的。所谓的大数据所表示的是数据来源多样、数据类型不统一、内容不全。
本文针对的是如何识别同一个客户
以下我们建立起一个数据实例:

No.安卓 IDIDFVCRM Card No.Wechat Union IDPhone No.
1oWx1024
29382100
3938210013800
4JJKKKJJoWx102413900
5IOIO111
6IOIO222oWX006413700
7IOIO33313800
8oWx204815900
9IOIO2229440000
1013800
1113100
12oWx102413200
13oWx2048
149440000oWx8096
15oWx809613400
16944000015900
17FFFFFJJ
18FFFFFJJIOIO111
19IOIO1119382100
20IOIO11113600
21adJJJJ
22oWx809615800
23oWx051213900
24oWx025613200
25JJKKKJJ17800
26IOIO888oWx012813400
27SSSSSIIOIO999oWx0128

四、搭建流程

Created with Raphaël 2.2.0 开始搭建 1、确定主标识 (例: UUID) 第一阶段 2、确定各平台的主次顺序 3、给出各标识对应唯一的主ID (例: 安卓 ID 对应唯一的 UUID) 第二阶段 4、确定各平台融合逻辑 5、融合 是否有需排除的融合条件 结束 6、把异常融合条件剔除 yes no

4.1)第一阶段 - 接入/整合

4.1.1 - 确定主 ID

在此例子中,我们先设定 Phone No. 设置为 主标识(UUID)

4.1.2 - 确定各平台主次顺序

如果我们不先预定各平台标识的主次顺序,我们就会陷入从哪里出发去找主标识(UUID),就会得出不同结果,如示例:

No.安卓 IDIDFVCRM Card No.Wechat Union IDPhone No.
6IOIO222oWX006413700
9IOIO2229440000
16944000015900

6条以及第16条可以很容易的标识为独立的一个人,但当我们在处理记录9时,我们是应该先以CRM Card No.平台标识进行识别还是先以IDFV进行识别,就会得出不同的结果。
所以在前期我们必须标识不同的优先级,并在匹配记录对应的主标识时严格按照优先顺序来匹配。

4.1.3 - 给出各标识对应唯一的主ID

当各平台标识可能对应多个 主ID 时,我们必须当最新产生的记录为最准确的(可以理解每次对应记录的不同为变更)。
如示例:

No.安卓 IDIDFVCRM Card No.Wechat Union IDPhone No.Last Update Date
4JJKKKJJoWx1024139002021-4-5
12oWx1024132002021-5-1
25JJKKKJJ178002021-3-8

当我们在再次遇到 oWx1024 这个 Union ID 时,我们需要认定这个对应的唯一一个 Phone No.13200

Wechat Union IDPhone No.
oWx102413200

同理对 安卓 ID 进行相同处理

安卓 IDPhone No.
JJKKKJJ13900

4.2)第二阶段 - 融合

4.2.1 - 融合流程

抽出实例数据如下:

No.安卓 IDIDFVCRM Card No.Wechat Union IDPhone No.Last Update Date
6IOIO222oWX0064137002021-5-4
9IOIO22294400002021-4-3
149440000oWx80962021-4-1
15oWx8096134002021-3-14
169440000159002021-2-28
22oWx8096158002021-2-3
26IOIO888oWx0128134002021-2-2
27SSSSSIIOIO999oWx01282021-1-3

以上记录,会根据时间的排序,得到以下这张主接触表

Phone No.安卓 IDIDFVCRM Card No.Wechat Union ID
13700IOIO2229440000oWX0064
15900
15800
13400IOIO888oWx0128

得到如下对应表格:

  • 安卓ID
Phone No.安卓 ID
13400SSSSSI
  • IDFV
Phone No.IDFV
13400IOIO999
13400IOIO888
13700IOIO222
  • CRM Card No.
Phone No.CRM Card No.
137009440000
  • Union ID
Phone No.Wechat Union ID
13700oWX0064
13700oWx8096
13400oWx0128

JSON 格式如下

{
    "UUID":"aaaa",
    "Main_Contact":{
        "Phone_No":"13700",
        "Android_ID":"",
        "IDFV":"IOIO222",
        "CRM_Card_No":"9440000",
        "Wechat_Union_ID":"oWX0064"
    },
    "All_Android_ID":[],
    "All_IDFV":["IOIO222"],
    "All_CRM_Card_No":["9440000"],
    "All_Wechat_Union_ID":["oWX0064","oWx8096"]
},

{
    "UUID":"bbb",
    "Main_Contact":{
        "Phone_No":"15900",
        "Android_ID":"",
        "IDFV":"",
        "CRM_Card_No":"",
        "Wechat_Union_ID":""
    },
    "All_Android_ID":[],
    "All_IDFV":[],
    "All_CRM_Card_No":[],
    "All_Wechat_Union_ID":[]
},

{
    "UUID":"ccc",
    "Main_Contact":{
        "Phone_No":"15800",
        "Android_ID":"",
        "IDFV":"",
        "CRM_Card_No":"",
        "Wechat_Union_ID":""
    },
    "All_Android_ID":[],
    "All_IDFV":[],
    "All_CRM_Card_No":[],
    "All_Wechat_Union_ID":[]
},

{
    "UUID":"ddd",
    "Main_Contact":{
        "Phone_No":"13400",
        "Android_ID":"",
        "IDFV":"IOIO888",
        "CRM_Card_No":"",
        "Wechat_Union_ID":"oWx0128"
    },
    "All_Android_ID":[],
    "All_IDFV":["IOIO999","IOIO888"],
    "All_CRM_Card_No":[],
    "All_Wechat_Union_ID":["oWx0128"]
}
4.2.2 - 隐含逻辑

必须以时间为先,且假定如果客户的标识并未能获取 主标识 即为已经解绑。
如下图:
我只是一个标识

4.2.3 - 异常排查

当某个主标识 绑定了超过5个平台标识,即可认为该 主标识 可能是公用机或为作弊行为。
当某个主标识 绑定了超过20个平台标识,即可认为为内不某些平台标识为默认编号,需排查。

这个阈值可以根据企业业务的不同而进行适当调整,如游戏平台的小号排查等。

五、后续

当能建立如此泛会员体系后,后续的分析便可以此为出发点,更框出客户的真实行为,以便进行更多维度、可能的分析。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
人脸识别的Python算法有很多种,其中一种经典的算法是基于特征脸法实现的。特征脸法是一种基于主成分分析(PCA)的方法,它将人脸图像转化为一个高维空间中的向量,并通过计算特征向量来识别人脸。 在特征脸法中,首先需要建立一个人脸数据库,这个数据库包含多个人脸图像样本。然后,将这些人脸图像转化为灰度图像,并将每个像素的灰度值归一化到0到255的范围内。接下来,将这些灰度图像转化为向量,并将这些向量按列的方式组合成一个矩阵。 然后,通过对这个矩阵进行主成分分析,可以得到一组特征向量。这些特征向量代表了人脸图像的主要变化方向,也就是人脸的主要特征。根据这些特征向量,可以将一个新的人脸图像转化为一个向量,并与数据库中的向量进行比较,从而识别出这个人脸的身份。 特征脸法的实现可以使用Python的科学计算库NumPy和图像处理库OpenCV。NumPy可以用于进行矩阵运算和主成分分析,而OpenCV可以用于读取和处理图像。 除了特征脸法,还有其他一些常用的人脸识别算法,例如基于局部二值模式(LBP)的算法、基于人脸关键点的算法、基于深度学习的算法等。这些算法可以根据具体的需求和应用场景选择使用。 中提供了关于Python实现人脸识别经典算法的参考价值。 中提供了基于Python的PCA人脸识别算法的原理及实现代码的详解。 中提到了人脸识别的算法多种多样,需要根据具体情况选择适合的算法。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值