问题描述
一句话概括:行列式点过程要解决的是,从一个候选集合中挑选出既相关又多样的推荐集合,其中候选集合的元素由两部分组成,一部分是文章和用户的相关性,由一个数字表示,另一部分是一个embedding或者向量代表候选是候选集合元素的content representation,论文中做的是拿到计算结果的一种快速计算方法。
本文主要讲解行列式点过程的公式推导,以及自己对此算法的理解,尽量保证讲解的完整性,最后附代码。
问题拆解
假设L是这么一个矩阵:,其中
的每一列为候选集中商品的归一化后的内容向量与用户的相关性分数的乘积,那每一列即有了内容维度的描述,又有了相关性维度的描述,那么
就可以写成如下的形式:
其中为相关性分数,
为内容向量。现在咱们要想从上式中求出能最大化多样性和相关性的子集,就需要借助行列式的性质:矩阵的行列式越大,对应的矩阵中任意两两向量的夹角越接近90度,也就是矩阵张成的体积越大,这样就把问题转化为从