微信朋友圈 Lookalike 算法

朋友圈的广告推送原理今天做点笔记,简单记录一下

Lookalike是做什么的

通常广告主投放广告,通过提交广告需求,后台圈定一部分潜在用户,这称为Lookalike模块

一般Lookalike的做法:
1、显性定位,广告主根据用户标签直接定位,比如说通过年龄、性别、地域这样的标签来直接圈定一部分用户进行投放。技术支持用户画像的挖掘。
缺点: 不够精准,通过标签指定的用户量大,需要精准筛选
2、机器学习来定位广告主的潜在用户。重点在于问题怎么转化成一个机器学习的模型呢?学习样本是什么? 优化目标是什么?

广告主提交一批客户名单,我们称之为种子用户,它作为机器学习的正样本。负样本我们会从非种子用户,或者是说平台会积累历史的一些相似的广告作为负样本,这个问题就转化为一个二分类的模型,正负样本组成学习的样本,训练模型之后,利用模型结构对活跃用户进行打分,最后得到广告主需要的目标人群。

在这里插入图片描述
回顾一下这个流程,广告主会提供他已有的客户名单作为种子用户,这是机器学习的正样本,然后会从活跃用户里面(非种子用户)或者历史我们已经积累了相似的广告负反馈的用户,作为负样本,训练一个二分类的模型,利用模型结果对这个用户进行打分排序,取出广告主需要的目标数据的用户

对于特征和模型算法,不同的公司各有差异:特征取决于公司有哪些数据

微信社交Lookalike是怎么做的

从微信朋友圈广告这个问题本身先做一些探索分析

微信朋友圈的广告和其他的广告平台差异点在于会因为好友行为(包括查看,点赞或者评论),导致自身关注率上升

数据拐点是3到5个好友
在这里插入图片描述

原因是社交关系数据的两个核心价值,社交同质性和社交影响力

同质性:即相似性,兴趣爱好,行业背景(小思考:协同过滤)

影响力:我的行为会受到好友的影响。那这个点投放到朋友圈广告上,我可以看到朋友对广告的反馈,会受到他的影响。

朋友圈广告,我们重点会挖掘这两个价值,就是社交同质性和社交影响力

出现两个问题

1、怎么挖掘潜在用户?

广告主提供名单的好友作为潜在用户

一、社交相似度
二、微信朋友圈的性质

这些导致同用户之间的行为会因为社会影响而形成传播,即微信社交Lookalike的基本思想。

2、社交同质性、影响力如何量化?

利用机器学习的方法对社交相似度进行量化

微信通过历史投放的广告采集到学习样本,对于有一部分好友我跟他历史上有同时曝光到一些广告,这些好友我可以计算出我跟他的广告相似度,就等于共同点击的广告数除以共同曝光的广告数

剩余的好友,历史上没有共同曝光过广告。那我们有其他领域的数据,比如说我跟他的亲密关系,浏览或者阅读文章等兴趣相同点,能否通过这些社交的行为数据,预测到我跟他在广告上的喜好度?

Tips:(冷启动,历史行为数据和多渠道找用户便好计算和预测)

接下来就是怎么把好友关系、文章兴趣等等特征工程

采用Word2Vec的思想,将图结构的特征表达,用降维方法把图里面的节点表达为隐空间的向量。

从Wodrd2Vec到node2vec,词里面单词的词频分布,它是幂律的,有些常用词出现的频率非常高,尾巴上的词出现的频率比较低

实际上在一个社交网络的节点也是这样的,我们经常会存在一些大的节点,他会有非常多的好友,有的人好友就达不到那么多。所以说其实在社交网络里面的一个节点的分布也是幂律分布。如何把Word2Vec迁移到node2vec,这个时候就要产生一个节点的序列,它对应到了自然语言处理的一条句子,图结构里面的节点相当于NLP的一个单词

所以在图网络上按照一个搜索的方法生成节点序列,这个节点的序列可以对应到自然语言的一个句子,后面我们通过Wodrd2Vec的框架,将节点embedding为一个向量。所以对于做network embedding的时候,这个生成节点序列的搜索策略非常重要。最简单的一个方法,就是随机游走,随机游走一方面生成节点序列,另一方面也是对图的一种采样,降低了计算量。

社交数据最重要的特征就是社交的同质性。

在network embedding的时候,需要把社交同质性这个特征保留下来。我们结合网络的社团性质对随机游走的算法进行调整,比如说A节点走到C,再走到E的时候,它再往下走,这边就相当于它会走到另外一个社团。它设置了一个节点P和Q,P大的时候它是往回走,因为社交网络的特征会形成这样的社团性。

当P越大,它会越能体现同质性。Q越大的时候,它其实能够体现这种结构的相似性,不同的节点有不同的作用。比如说F节点和E节点它是连接这两个社团的桥接点。当Q大的时候,它体现的是网络结构的相似性。这时候我们怎么选P和Q?这个可以根据实际任务进行半监督的学习。
在这里插入图片描述
回顾一下刚才我们说的Node2vec的流程,首先通过有偏随机游走,生成一个节点序列,后面是word2vec的算法框架得到这个节点的向量表达。其中的参数调优,根据我们保留的同质性,或者根据实际的任务进行调参。

给大家看一下node2vec的结果,先给大家看这个算法的输出。这里有一个简单的图,做embedding之后的结果,1和2的节点向量是一样的,它会是重叠的一个向量,3、4、5、6也是一个重合的节点,它表达的是什么呢?为什么1和2完全重叠?其实1和2的网络环境是一模一样的,这个embedding的结果表达是是节点的社交网络环境,也就是我们说的拓扑特征。
在这里插入图片描述
node2vec还会有其他什么好处呢?以好友沟通网络为例,我有120个好友,实际上我沟通网络并不会跟那么多好友经常聊天,也就是说这个数据非常稀疏,在node2vec的输出结果上再计算亲密度,其实我跟所有好友的亲密度都是可以计算出来的。第一个带来的好处就是解决数据的稀疏性的问题。另外,这个结果具有稳定性。

对于沟通网络,比如说,我跟一些好友沟通可能是事务性的,不能表达亲密度的。比如一些客户,或者服务中介等,因为我跟他没有形成社交圈,在做embedding的时候, 产生序列的邻居共现次数比小,embedding出来的结果就是这些人员在亲密度排序上会排在后面,而相对来说,真实关系紧密的,比如亲人,闺蜜,同学,同事会比较稳定的排在前面。

对社交相似性的学习框架,大家可以看下面的图。 我们建立一个回归的model。现在做的是SVR模型。输入好友网络,沟通网络、文章的转发阅读网络等等,进行embedding得到特征向量表达,通过SVR模型,学习到这些特征和广告相似度的函数关系。这个函数关系计算出好友相似度,可以对好友进行排序。
在这里插入图片描述
评估算法的效果,最直接的就是说我有多个算法,广告主需要100万的用户,我这几个算法都给出100万用户,然后看一下这100万的用户点击量是怎么样的,我们叫Lift值。其他的算法跟它进行对比,看一下它的效果有没有提升。那我们的算法相比直接的二分类模型有2倍-3倍的lift。

在这里插入图片描述

总结

本次主要介绍了社交Lookalike的探索性的分析,社交的同质性和影响力,并重点分享了社交同质性量化问题。后面我们希望把Lookalike系统做成一个动态的,比如我为某个好友点赞,下面我需要推送的人是我的好友,我能影响到那些好友。把这个社交影响力进行量化,并且结合到广告投放里面去。假如说用户能够形成主动传播广告,这样的话它是一个非常好的局面,相当于用户自助的对广告进行口碑的传播

https://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2650995211&idx=1&sn=8e32b5590b8e8bff8a5bd8bfb2ceaa7a&chksm=bdbf02588ac88b4e32ea5320e10c7a2e5ac762ea580e7fce8320b6d5c74a273c13410f5475cf&mpshare=1&scene=1&srcid=1113PKe46JDctFjdSYliBqJA&sharer_sharetime=1605281707177&sharer_shareid=92e34dc18a3bce04ae2b8f23d68cf0c9&key=2db1b935a464a467a643eac5eb2b6857701c4c25739aa32567de535b2a59ca7c7815d5faeebcf2e837c90865e41514a5b625e09bc7086f34a3fe2764c12e704d13e8a46bd0fbfb2519645a5072519afe7ed701ca19d0759d2e82cec05f956230837cc84acb577d109aaf6f19788e05d3c7a73473f86c109ff099f8d1de07188e&ascene=1&uin=MTk4NjIyMzUyMQ%3D%3D&devicetype=Windows+10+x64&version=6300002f&lang=zh_CN&exportkey=A%2FZRu8nHq5hoKG7CHso%2Ftok%3D&pass_ticket=nHIX1vQx23FNH5zUZBx021dUCp6y8RRlqR5Sv8FfaX679ubp1cTu06siZBmz7S9e&wx_header=0

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值