小红书冷启优化-笔记_小红书冷启动-CSDN博客

本文链接：https://blog.csdn.net/liuhe2296044/article/details/143849034

1.精准推荐。

2.激励发布。

3.挖掘高潜。

1.优化全链路（召回和排序）

2.流量调控（新老物品的流量分配）

用户侧：

item自身：新笔记点击率、交互率。（一定时间内，区分高、低曝光看ctr cvr）

高热笔记占比（统计前30天内获得1w曝光的item占比）

双塔召回

ID Embedding优化方法一：item_id向量使用defaultEmbedding

ID Embedding优化方法二：利用多模态（CNN+Bert）把item表征成向量，取多个高曝光的item的向量meanpooling作为冷启item的Embedding。

使用用户画像的关键词进行召回。维护类目_id 或者关键词 -> item_i的时间倒排，召回合并多个列表。（弱个性化、但是强时间）

物料自身的基本属性，关键词提取召回（比如物料中包含的公司名，人名，地名等）

聚类召回
思想：根据用户行为last_n ，推荐内容相似的笔记
离线：训练基于图文（Bert+CNN+FC）神经网络模型，（利用类目和点击数据生成pair-wise样本）。
线下训练：多模态神经网络把图文内容映射到向量。
线上服务：last n->n个特征向量->n个Cluster->n*m个新笔记。
实现细节：使用（CNN+Bert）对item的图文进行表征得到向量，K-means聚类（余弦）得到1000个cluster。新item发布后想转成向量，然后计算最相似的Cluster，然后加到当前cluster的索引中【Cluster->item_id时间倒序】。
Look-Alike召回
线下训练：用item交互过的user的向量mean-pooling得到item的向量，存到milvus。
线上服务：先得到user的向量，然后从milvus取TopK个item

实现细节：Look-Alike其实就是一种特殊的ucf，并且对于item冷启是比较有利的，因为新item的emb是学习不充分的，但是交互的user不一定是新用户，他的emb可能是学习充分的，这样利于item冷启