天池推荐系统多路召回

最新推荐文章于 2023-01-29 02:07:45 发布

The__Song

最新推荐文章于 2023-01-29 02:07:45 发布

阅读量274

点赞数

分类专栏：推荐系统文章标签： python

本文链接：https://blog.csdn.net/qq_37501555/article/details/110410006

版权

多路召回在推荐系统中扮演重要角色，通过不同策略、特征和模型确保候选集的快速召回和高覆盖率，同时避免对排序效果的负面影响。本文涉及工具函数的使用，如用户-文章-时间、文章-用户-时间的获取，历史和最后一次点击信息，文章属性特征，用户历史点击记录，以及多路召回字典的定义和召回效果评估。

摘要由CSDN通过智能技术生成

推荐系统多路召回

多路召回是推荐系统中非常关键的一步，目的是要在不同的策略、特征或模型中选出的候选集合中生成一个新的混合排序模型。其中，各种简单策略保证候选集的快速召回，从不同角度设计的策略保证召回率接近理想的状态，不至于损伤排序效果。对于不同的业务，要考虑不同的召回规则。

工具函数

作为数据处理的前置准备

获取用户-文章-时间函数：基于关联规则的用户协同过滤的时候会用到

# 根据点击时间获取用户的点击文章序列   {user1: {item1: time1, item2: time2..}...}
def get_user_item_time(click_df):
    
    click_df = click_df.sort_values('click_timestamp')
    
    def make_item_time_pair(df):
        return list(zip(df['click_article_id'], df['click_timestamp']))
    
    user_item_time_df = click_df.groupby('user_id')['click_article_id', 'click_timestamp'].apply(lambda x: make_item_time_pair(x))\
                                                            .reset_index().rename(columns={
   0: 'item_time_list'})
    user_item_time_dict = dict(zip(user_item_time_df['user_id'], user_item_time_df['item_time_list']))
    
    return user_item_time_dict

获取文章-用户-时间函数：基于关联规则的文章协同过滤的时候会用到

# 根据时间获取商品被点击的用户序列  {item1: {user1: time1, user2: time2...}...}
# 这里的时间是用户点击当前商品的时间，好像没有直接的关系。
def get_item_user_time_dict(click_df):
    def make_user_time_pair(df):
        return list(zip(df['user_id'], df['click_timestamp']))
    
    click_df = click_df.sort_values('click_timestamp')
    item_user_time_df = click_df.groupby('click_article_id')['user_id',

最低0.47元/天解锁文章

The__Song

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
天池推荐系统多路召回

推荐系统多路召回多路召回是推荐系统中非常关键的一步，目的是要在不同的策略、特征或模型中选出的候选集合中生成一个新的混合排序模型。其中，各种简单策略保证候选集的快速召回，从不同角度设计的策略保证召回率接近理想的状态，不至于损伤排序效果。对于不同的业务，要考虑不同的召回规则。工具函数作为数据处理的前置准备获取用户-文章-时间函数：基于关联规则的用户协同过滤的时候会用到# 根据点击时间获取用户的点击文章序列 {user1: {item1: time1, item2: time2..}...}de
复制链接

扫一扫

专栏目录