凑单算法zhon中的Graph embeding:
核心为一下两部分:
1. 基于图的随机采样
1.1 图的构建
节点:item; 边:item与item 共同被购买; 边权重是:共同购买的次数、时间
1.2 采样《item,item》
正样本:基于权重概率采样
负样本:随机取无共同购买的item
2. embeding + DNN有监督分类
1.1 样本: 与graph有异。
某用户在某一天的行为可以记为(m1,r1),(m2,r2),…,(mn,rn)(m1,r1),(m2,r2),…,(mn,rn)其中mi∈M,ri∈{0,1}mi∈M,ri∈{0,1},此处MM表示商品的集合,ri=1ri=1表示用户购买了mimi,反之则只是点击而没有购买。对于用户行为序列中的任意两个商品,我们将商品对x=(mi,mj)x=(mi,mj)标记为正例t=1t=1,如果ri=1∧rj=1ri=1∧rj=1;否则标记为负例t=0t=0。以此我们构造了二分类任务的数据D={(x,t)}D={(x,t)}。
1.2模型优化:损失函数考虑负样本的可信度,因为同一个负采样对,在不同用户的正负不一致。因为对同一个item 不同对应负item添加了一个间隔r失模块。
3. 感触
真真假假