我们一起来说说Lookalike的那些事儿

随着数字广告的出现,广告从原来的受众被动接受转变为双向互动,并且广告的效果也变得可量化可跟踪。随之而来的,广告主对于受众定向也产生了越来越强烈的需求,如何在合适的时间把合适的内容推送到合适的受众面前,成为广告主对广告技术公司的普遍要求。
而针对这个普遍要求,如何找到适合广告主品牌定位的某款产品的目标受众群,往往成为某次广告营销活动的起点。对于这个任务的达成,目前主要有两类主流做法:
一类是直接基于DMP的三方数据,通过标签选取或LBS等方式为广告主选取目标受众群,这种做法更多的依赖业务人员对业务、产品、市场的了解,有时候业务经验不一定准确,而且通过标签或者LBS筛选出来的人群规模不容易控制,需要进行多次反复的尝试,最终确定符合某次投放要求的目标人群数量。
第二类是通过广告主一方数据或二方数据通过Lookalike算法选取目标受众群。这种做法更多的依赖大数据和机器学习算法,对探索新的业务逻辑,例如对于某款新产品的市场推广,并无很多的业务经验积累的场景比较适用,而且也更符合大数据营销的发展趋势。本文将主要围绕该种方式展开。
既然Lookalike是辅助业务人员和市场营销人员获取精准目标人群的有力工具,很多提供广告DMP数据服务的公司都宣称自己有Lookalike算法,仿佛有了高大上的算法附体,自然找人群就能精准几分。而找到了精准人群,自然后续的转化都不是问题,在这样的逻辑下,Lookalike成了DMP数据服务公司的标配。于是一个问题就提出来了,作为一个广告主,如何判断各家的Lookalike算法孰优孰劣,怎样的Lookalike算法才是真正符合广告主要求的算法呢?下文将从广告主的视角进行深入的解读。

Lookalike的基本流程

Lookalike字面上来讲就是寻找相似性,广告主提交一系列客群范围,我们称之为种子客群,它作为机器学习的正样本。负样本会从非种子客群,或者是说平台历史积累的一些人群中进行选取,于是Lookalike问题就转化为一个二分类的模型,正负样本组成学习的样本,训练模型之后,利用模型结构对活跃客群进行打分,最后得到广告主需要的目标人群。

回顾一下这个流程,我们会发现Lookalike在应用上有三大关键点:

第一、用来学习的数据维度很关键

可以说,学习的数据维度就是在哪些方面寻找相似的客群,也就是说你的目标客群会突出在哪些方面有一些特征的聚集。学习的数据维度包含几个层次:
1)行为结果数据
所谓行为结果数据是已经采取了具体行动的数据,例如购买数据,入资数据等。
2)行为意向数据
所谓行为意向数据是倾向于采取某种行为的人群数据,最典型的是搜索引擎的数据,一般来说消费者在做最终的购买决策之前,往往会通过搜索引擎了解产品周边的一些相关信息,相关搜索关键字数据可以定位到一个有强购买倾向的人。这也是很多广告主投入较多预算在SEM上的原因。但这种数据一般很难从搜索引擎侧获取,购买关键字的成本也越来越高。一般来说,通过行为意向数据来寻找人群,转化率会比较高,因为行为意向人群往往已经达到了转化前的最后一步的关键时刻,此时对意向人群进行营销,效果往往很明显。但同时广告主也面临一定的风险,因为这时客户可能已被别的竞品在更早的环节进行了影响,转化成本也相应提高。
3)行为偏好数据
对于大多数第三方DMP平台来说,主要还是通过这一类数据来帮助广告主找到潜在的人群,从业务逻辑来说,具有某种偏好或者属于某种类型的人群往往会更倾向于购买某款产品,对于这部分数据的学习也能促成最终的转化。而且行为偏好数据会保证广告主在潜在客群覆盖规模和精准度之间达到一个很好的平衡,因此也是广告主普遍选用的一种数据。
4)行为模式数据
所谓行为模式是指通过分析消费者的行为与时间、空间的关系,以及一系列行为之间的时间和空间序列关系,总结出的具有一定一致性意义的行为表现,通过这些一致性模式预测相关行为。行为模式数据往往应用于场景营销,但是由于加工行为模式的数据计算复杂度较高,同时对分析的实时性要求也很高,因此目前还处在探索和优化阶段,实际的应用落地不多。
上述所说的几类数据在营销领域各有其价值,并不能判断孰优孰劣。结合具体广告主的需求都可以达到比较好的效果。

第二、Lookalike算法是否工程化

Lookalike算法本身其实并不复杂,但是目前很多DMP平台提供的Lookalike算法对于广告主来说更像是一个黑盒子,一方数据输入进算法后,通常广告主并不知道算法内部发生了什么,也并没有留有可供业务人员参与的接口,只需等待算法按你的要求输出指定类型的数据。通常来说,广告主只有在通过线上广告真正触达到相关受众群体之后,才能了解机器学习的效果是否符合预期。
对于这种Lookalike算法的客户体验肯定是不好的,判断某家DMP是否能在广告营销中为广告主带来价值,通常比拼的是Lookalike算法工程化方面的实力,这些实力体现在以下方面:
1)算法的学习维度是否可以调节
虽然理论来说,Lookalike算法维度增多对提高学习精度是有利的,但是现实生活中人群表现出的一些特征有时候是出于主动选择的结果,有时候是由于客观条件限制导致被动选择的结果(例如某款产品只在部分区域发售),因此对于算法的学习维度需要具备预先手动调节的能力,排除掉一些不必要的学习维度。
2)是否可以根据相似度选取最终人群的规模
对于学习输出的人群,与种子人群的相似度越高就说明越符合要求,但同时规模也越小。一次广告营销所需要触达的人群会根据本次营销的目标不同而有很大的变化,例如对于品效兼顾的营销,人群触达的规模也是一个非常重要的指标,而对于纯粹效果类广告,则是希望能够触达尽可能精准的目标人群。通过相似度灵活的选取最终人群的规模,对于业务人员来说,是一个非常有用的功能。
3)学习结果是否可设定过滤条件
具体的营销活动会有很多限制,例如某款游戏在IOS和Android上的营销预算不同,因此希望IOS目标人群和Android目标人群规模符合一定的比例;某些垂直媒体主要做三四线城市的下沉,希望更多选取三四线城市的人群等,可以通过灵活的条件筛选会使得算法可以支持更多更丰富的应用场景。
4)一些工程化指标
其他一些工程化指标对于算法的易用性、可用性非常重要,例如现实情况中的数据质量往往不是特别好,用来学习的样本数据维度很多时候不完整,甚至有些样本的某些维度是缺失的,这就要求算法能很好的适应这种不完整的数据,同时保证精度不迅速恶化;
在现实业务应用场景中,营销业务人员通常不具备很深度的数据挖掘背景,因此挖掘算法在应用环节不应该设计的非常复杂,如需要业务人员调节某些参数来优化模型的精度等;
算法的效率和收敛速度同样非常重要,对于动辄上亿的样本,几百万的特征维度来说,业务场景要求在分钟量级返回计算结果,因此算法的性能和各厂家的计算能力是非常大的门槛。

第三、Lookalike算法的应用Tips

1)结合聚类算法一起使用
有时候客户提供过来的种子人群成分是非常复杂的,往往是参杂了大量子类人群的总和,如果直接拿这些种子人群进行lookalike,则相当于把人群的特征进行了弱化,最终找出来的相似人群特征会变得不明显。例如某奢侈品牌,他们的一方种子人群中包含2类,一类是真正有钱的人群,平时开豪车住别墅的,另外一类是普通的城市小白领,他们往往攒好几个月的工资进行一次消费。这2种人群必须先通过聚类算法区分出来,然后再输入Lookalike算法去扩大。
2)在什么媒体上用
Lookalike算法选出的人群最终是在媒体的流量人群中实现触达,因此媒体自身流量对最终Lookalike算法落地的效果影响非常大,例如我们做过的某次营销案例,选取某DSP做为精准营销的落地媒体,在整个4周的营销过程中,最终选取的精准人群只有2%曝光成功。(一方面由于该DSP媒体流量均为长尾流量,而我们选取的目标人群为金融类目标人群,该DSP对目标人群覆盖率低,另外由于低价策略,竞价成功率低也导致了最终触达的精准人群规模比较小)最终我们分析了这2%成功曝光的人群,发现他们也是Lookalike算法相似度相对较低的,也就是说最相似的那部分目标人群在该媒体上并没有出现和竞得。
因此为了保证Lookalike算法落地的效果,选取与广告主自身产品相对匹配的目标媒体以及合适的出价都非常重要。
3)根据效果数据优化Lookalike算法
一旦精准营销活动开始后,就可以回收消费者对营销的反馈数据做为正样本来对Lookalike算法进行优化。通过TalkingData对大量历史投放数据的分析,动态优化Lookalike算法可以极大的提升算法的转化效果:在同样选取相似度TOP100w样本进行精准投放的情况下,每日优化样本库组相比较不优化组在一周的投放周期内,可提升激活率180%以上。样本库优化的周期可以根据效果数据回收的量级、媒体的技术支持能力、以及DMP平台自身的数据更新周期综合决定,建议每1-2日更新目标用户群。

【总结】

以上是对Lookalike算法应用需要注意的一些关键点进行的分析,总之,任何算法并不是孤立存在的,必须结合数据及业务场景进行合理的应用才能发挥最大的价值,TalkingData致力于和广告主一起,探索其中的奥妙。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

易通慧谷

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值