案例来源:@阿里技术
案例地址:https://mp.weixin.qq.com/s/pA1SSEnwC884LBZGiH3jhg
1. 背景:一些用户对品牌有偏好,但是目前天猫的排序系统是将品牌混杂着推给用户的,不能满足品牌偏好用户的需求
2. 目标:设计一个品牌排序系统,按照用户偏好的品牌顺序向用户推荐商品(如用户搜索词是jeans)
3. 特征工程
1)价格:
a. 将目标品类商品按照价格排序,划分为7个区间
b. 给定一个品牌,统计品牌在每个价格区间内最重要的8个电子商务特征
c. 相乘后得到56维的价格特征
2)品牌:传统是采用onehot编码,但如果两个品牌相似,onehot就遗漏了品牌相似的信息。因此采用如下方法:
a.
b. 得到品牌的嵌入式表示
(可以这么理解嵌入式表示:
i1. 启发式表示+精调:vk是启发式的;通过训练数据,我们对品牌信息进行精调;
i2. 先验信息+后验修正:vk是基于品牌的先验知识得到的,而我们根据品牌训练数据中的后验信息进行修正;
i3. 内容信息+协同信息:vk是内容信息,M*o引入了用户行为的协同信息)
3)品牌-行为交互:由于用户行为类型有很多种(点击、收藏、购买),对每种行为类型进行onehot编码,然后通过矩阵相乘的形式得到特征
4. 分类器:改进的Attention-GRU(注意力机制-门控-RNN)
5. 效果评估:
1)离线评估:
a. 取每个用户最近11个行为,前10个行为作为训练集,第11个行为点击的品牌作为正label,然后随机生成一个品牌作为负label
b. 训练模型并检验
2)在线评估:
a. 取部分在线用户,在搜索结果页增加“brand”按钮,点击后可以切换为本文品牌排序结果
b. 对比没点击“brand”用户和点击“brand”用户的CTR、ATIP、GMV,GMV提升了3.4%
【这里有个问题,点击了“brand”的用户是已经对品牌有偏好的用户,所以两类人群是不同的。一般而言,品牌偏好更强的用户,消费能力越高,因此GMV自然也比较高。】