品牌内容发现(三)Learning Visual Elements of Images for Discovery of Brand Posts

最新推荐文章于 2024-10-06 23:55:17 发布

薛定猫的谔w

最新推荐文章于 2024-10-06 23:55:17 发布

阅读量122

点赞数

分类专栏：品牌项目文章标签：深度学习 pytorch

本文链接：https://blog.csdn.net/csdn_tclz/article/details/108858326

版权

品牌项目专栏收录该内容

8 篇文章 0 订阅

订阅专栏

背景

之前讲到过，品牌内容发现(content discovery for brands)这一问题被定性为基于内容的排序学习问题。
这种利用品牌的历史post来学习其与品牌的相关性从而对新的post进行排名的任务，主要难点有三：
（1）品牌之间的相似性问题。多个品牌可能使用相同的品牌联想内容，导致本品牌的post与竞争对手使用的post仅有细微差别，难以区分
（2）brand-post之间的稀疏性问题。事实上，几乎不会出现两个不同品牌都转发了某个帖子这样的情况。这也是与推荐场景所不同的地方（通常来讲，推荐任务中每个user可以和多个item有过交互，比如点赞、评论、浏览等），brand-post之间的稀疏交互使得两者的协同信息匮乏。
（3）每个brand的历史post具有多样性。每个brand可以拥有多重属性特征。下图给出的例子，
在这里插入图片描述
如每个post右上角标记的颜色属性那样，它们或多或少都在突显出所属品牌的某些属性特征。比如绿色折射的品牌属性为年轻、时髦等；红色折射高质量、别致等这样的品牌属性。事实上，不同的post被用于强化突出不同的品牌属性，同时也是针对了风格各异的受众。

贡献

上一篇提到了用于解决这一问题的个性化内容发现(PCD)框架。这篇文章在将PCD营销领域知识结合概率优化方法，把品牌属性整合进来，提出了新的PCD框架。
原PCD模型总览：

PCD框架结构（PCD加强版）
在这里插入图片描述
从图中可以看出，brand和post表示均在原来的基础上，分别通过attributes向量和concepts向量进行concate补充。即最终品牌表示为 $b=BrandRL(b)=cat(b_x,b_a)$
$b_x$ 同PCD中计算的通用品牌表示， $b_a$ 是属性特定的品牌向量(attributes-specific brand vector)，通过下式计算得到
$b_a = \sigma(\varnothing_a(\bold a))$
其中 $\sigma$ 是sigmoid函数， $\varnothing_a$ 是两层感知机。
同样地，对于每个post表示，有 $p = cat(p_x,p_c)$
$p_x$ 同PCD中的通用post表示， $p_c$ 是属性特定的post向量表示。 $p_c = \sigma(\varnothing_c(\bold c))$
$\bold c$ 是ImageNet中使用的1000个concepts。出发点是从concepts的分布中学习 $p_c$ ，假设营销者使用联想概念来建立品牌属性。新增加的属性表示向量的约束，目的是让post $\bold p ,\forall p \in \bold H(b)$ 的concepts向量 $p_c$ 与品牌属性向量 $b_a$ 距离要近一些。
不过这里，并没有直接使用如 $p_c$ 和 $b_a$ 之间的均方误差来度量是否离得“近”，原因：由于每个brand的历史post具有多样性，这类评价方法会对离群点(outliers)比较敏感，容易影响到最终精度。 文章使用的概率优化算法，使得post的concepts向量只需服从某种特定的分布即可。文章中给出的一个例子，假设BMW这个品牌在"Upper Class"这个属性上有较高分数，那么该品牌所有post在"Upper Class"属性上的分数值应该接近brand在该属性的分数。
在这里插入图片描述
那么，带有BMW logo的饮料罐在该属性上可能分数较低，应该被视作离群点。这样一来，文章相当于做出了一种假设，即对于每个品牌 $b$ 的属性 $i$ ,相应的有个分数 $a_i$ ，该品牌的所有history posts在该属性上同样的有它们的分数 $p_{ci},\forall p\in \bold H(b)$ 应该服从一个以 $c_i$ 为均值， $\Sigma_{b,i}$ 为标准差的一维正态分布，换句话说，此约束的目的在于使得 $p_c$ 中属性特定的分数值 $p_{ci}$ 要同品牌相应的属性分数值 $a_i$ 接近。
经过加强的brand表示和post表示之间有个Margin Rank Loss，计算方式同标准PCD。追加的属性特征表示向量通过KL散度来约束量其分布差异。
在这里插入图片描述
如上图右侧，通过KL散度来对分布进行约束。使得绿色和黄色表示的不同品牌的post属性特征分布 $Q_1$ 和 $Q_2$ 向真实分布 $P_1$ 和 $P_2$ 靠拢。
优点：
通过建模分布而不是数据点本身，能够使得学习方法不受这种离群点情况的影响，只会拟合那些接近共识的post。

算法过程

在这里插入图片描述
KL散度对分布的约束 $D_{KL}(P||Q) =\sum_iP(i)log_2\dfrac{P(i)}{Q(i)}$
最终的约束表达为
$L_{PCD*} = L_{PCD} + \alpha\sum_{b=1,2...,B}\sum_{i=1,2,...,M}D_{KL}(P_{bi}||Q_{bi} + \beta ||\theta||_2)$
$\theta$ 是参数集合， $\alpha$ 和 $\beta$ 是加权参数。