带标签数据的sku嵌入方法
方法名:Label Informed Attributed Network Embedding
简称:LANE
sku嵌入向量中应包括:user对sku的行为,sku属性,sku标签
算法基本流程
- 从用户对sku的pv序列构造网络
- 清洗出sku属性
- 输入模型计算嵌入 LANE(network,attribute,(label),dim)
- sku嵌入向量评估
- 输入seq2seq训练
- 预测
LANE 细节
网络的构造
- 从hive表里得到用户对sku的pv序列
- 将相邻的sku关系,设置为网络中node之间有一条有向边
算法伪代码
Algorithm :Label Informed Attributed Network Embedding
Input: d d d(嵌入维度)
Input: m a x _ i t e r max\_iter max_iter(迭代次数)
Input: G G G(带权邻接矩阵)
Input: A A A(属性矩阵)
Input: α 1 \alpha _{1} α1, α 2 \alpha_{2} α2(权重参数)
Output:H(sku嵌入矩阵)
设sku数量(即构造图中的节点数量)为 n n n,sku属性的维度为 m m m, sku标签的维度为 k k k,sku嵌入向量维度为 d d d
G ∈ R n ∗ n , A ∈ R n ∗ m , Y ∈ R n ∗ k G \in R^{n*n}, A \in R^{n*m}, Y \in R^{n*k} G∈Rn∗n,A∈Rn∗m,Y∈Rn∗k
S ( G ) , S ( A ) ∈ R ( n ∗ n ) S^{(G)},S^{(A)} \in R^{(n*n)} S(G),S(A)∈R(n∗n)
L ( G ) , L ( A )