【数据应用案例】人群优选算法模型,挖掘品牌潜客

案例来源:@阿里巴巴机器智能

案例地址:https://mp.weixin.qq.com/s/OF51cPHD7C3rfw-WW5NA3Q

 

导读:

为A电商做年货节品牌营销,目标是识别目标受众,广告投放后由“机会人群”转向“兴趣人群”的比例更高。

解决方案是:

第一步:多方向人群扩散。通过兴趣偏好、品类偏好、竞品受众、搜索人群、流失人群、lookalike人群 六个方向获得潜客名单,去重后得到候选用户集

第二步:人群优选算法。以已购过A品牌的用户为正样本,购买过其它品牌的用户未负样本,训练分类器。

第三步:年货人群模型。专门为年货场景训练的分类模型。

第四步:模型融合与预测。

效果是“机会人群”到“兴趣人群”的转化率提高了47%。

 

0. 背景:

    1)广告分成品牌广告与效果广告,效果广告关心效果,即当期的转化率;品牌广告关心曝光与影响力,即提高未来的转化率。传统品牌广告的弊端在于难以量化效果,阿里巴巴由于能监控到广告投放与用户行为的链路,因此能够对品牌广告的营销效果进行量化

    2)阿里巴巴将用户对品牌的感知区分为Opportunity(机会)、Awareness(认知)、Interest(兴趣)、Purchase(购买)、Loyalty(忠诚),“O→I”的转化衡量品牌广告的效果,即机会人群转化为兴趣人群的比例

    3)以A品牌年货节品牌推广活动为案例,利用本文算法挖掘目标潜客,相对于传统根据业务规则圈定的目标潜客,“O→I”转化率提升了47%

 

1. 目标:找到A品牌目标潜客,提高品牌广告投放的“O→I”转化率,从而提升A品牌的消费者资产

 

2. 传统业界方法

    1)标签扩散:根据已有用户画像,拓展到具有相似用户标签的用户群

    2)基于标签的协同过滤

    3)基于社交关系的扩散

    4)基于聚类的扩散:根据用户画像进行聚类

    5)目标人群分类方法:以种子人群为正样本,随机其它对象为负样本,训练分类模型

 

3. 多方向人群扩散+人群分类优选

    1)多方向人群扩散:探索6类方向,通过白盒条件筛选、黑盒模型预测的方式得到候选用户集,然后将用户集汇总后去重。

        a. 兴趣偏好方向:采用特征值TGI指数和TA浓度两个指标,得到各特征对于区分品牌偏好的有效程度,从而找到可以合理筛选出品牌目标用户的指标(TGI指数衡量特征值在品牌人群中的显著性,TA浓度衡量特征值在品牌人群中的覆盖率)

        b. 相关品类方向:(1)利用brand-user矩阵,采用jaccard相关系数计算品牌相关性;(2)利用user-category矩阵,采用关联分析得到各类目的相关类目

        c. 竞品人群方向:(1)竞品:A品牌主营类目下,top10的其它品牌为竞品;(2)人群流转分析:计算A品牌新增人群中多大比例来自竞品,判断该方向是否有效;(3)竞品人群转化模型:以来自竞品的人群为目标,挖掘用户在竞品的AIPL状态、退款、退货、评分、评价等特征,训练竞品人群转化模型。通过模型对竞品人群进行转换预测,实现人群扩散

        d. 搜索人群方向:(1)找到搜索关键词:综合考虑搜索词是否充分竞争以及本品牌在搜索词上是否有优势,一个搜索词引导到品牌的成交额占比越高,该搜索词越重要;(2)选择近15天搜索了关键词并点击了A品牌主营类目的用户作为扩散用户

        e. 流失人群方向:之前属于品牌人群而现已流失了的用户,进行扩散召回,包括近半年从IPL状态流失的用户和近1个月从A状态流失的用户

        f. 同好人群方向:找到与种子用户相似度最高的topN用户,相似度计算的方法有两种 (1)用户偏好的类目向量、品牌向量组合;(2)将user-item表示为二部图,基于graph embedding方法生成用户向量

    2)人群分类优选:

        a. 评估方法:PredictTA TopNPrecisio指标,表示优选的TopN人群中品牌目标人群的占比,该指标越大说明模型预测效果越好

        b. 样本选择:正样本为A品牌已购人群(对于小品牌,可能需要加入兴趣人群等扩充正样本);负样本为全网其它品牌的已购人群(如果是全国随机其它人群,容易踩到很多特征稀少的用户)

        c. 特征工程:(1)数值型特征离散化:年购物天数、近30天订单数等特征进行等距离散,提高模型稳定性和效果;(2)枚举型特征值筛选。汽车型号、收货省份等特征长尾分布非常明显,筛选出与目标品牌相关的特征值;(3)特征编码:onehot化;(4) 稀疏特征embedding:如品牌id、类目id,以品牌作为word,活跃用户的行为作为doc,利用word2vec的方法做词嵌入;(5)特征选择

        d. 模型训练:(1)LR作为baseline;(2)rf,效果不好,并且特征重要性只能精确到特征而不能到特征值维度,去除;(3)PS-SMART,基于PS架构的GBDT模型,效果较lr好

        e. 训练效果:

        f. 模型预测:使用训练好的人群优选模型,对通过6个方向扩散的人群进行筛选,去掉预测分数小于0.5的用户

 

4. 年货人群模型:屯年货是一种特殊的消费场景,与日常消费行为不同,因此需要单独建模

    1)样本选择:以农历时间为记,选取去年同期前一个月有行为的用户作为样本。根据这些用户在去年同期到元宵节的行为打正负样本标识,转化到品牌PL状态的用户为正样本,随机采用同等数量的其他用户为负样本

    2)特征工程:

        a. 人群属性特征

        b. 人群偏好特征:偏好品牌、生活标签、偏好类目、及偏好品牌等特征

        c. 品牌主营类目行为特征、品牌相关年货类目行为特征:有行为的相关年货类目id、类目相关性等

    3)模型训练:PS-SMART算法作为分类器

    4)模型预测:圈选投放日期前1个月对品牌主营类目及相关年货类目有行为的用户,使用年货人群模型进行预测,去除预测分数小于0.5的用户,根据拉新目标去除品牌现有IPL人群

 

5. 模型融合:

    1)根据日常人群优选模型和年货人群模型的PredictTA TopN Precision指标,确定目标人群中2个模型优选结果的占比,最终筛选出指定数量的投放人群,导入数据银行,供服务商同步到DMP进行品牌广告投放

    2)效果:品牌A根据本文模型筛选目标潜客,服务商根据策略中心找出A的目标潜客,分别在钻展投放。本文算法在“O→I”的人群关系加深率上提升了47%

 

 

 

  • 4
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值