![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
推荐系统
The__Song
这个作者很懒,什么都没留下…
展开
-
天池推荐系统排序模型+模型融合
排序模型通过召回几经根据数据的不同特征缩减了问题的规模,接下来就是使用监督学习来对各种特征使用训练集进行表征,然后对测试集进行预测,得到测试集中的每个候选集用户点击的概率作为最终的结果。排序阶段选择了三个比较有代表性的排序模型,它们分别是:LGB的排序模型LGB的分类模型深度学习的分类模型DIN得到了最终的排序模型输出的结果之后,还选择了两种比较经典的模型集成的方法:输出结果加权融合Staking(将模型的输出结果再使用一个简单模型进行预测)import numpy as npi原创 2020-12-06 22:07:26 · 361 阅读 · 0 评论 -
天池推荐系统特征工程
推荐系统特征工程基于召回的结果, 构造特征,制作标签,形成一个监督学习的数据集。数据读取训练和验证集的划分缓解制作排序特征时的压力。# all_click_df指的是训练集# sample_user_nums 采样作为验证集的用户数量def trn_val_split(all_click_df, sample_user_nums): all_click = all_click_df all_user_ids = all_click.user_id.unique()原创 2020-12-03 23:19:37 · 146 阅读 · 0 评论 -
天池推荐系统多路召回
推荐系统多路召回多路召回是推荐系统中非常关键的一步,目的是要在不同的策略、特征或模型中选出的候选集合中生成一个新的混合排序模型。其中,各种简单策略保证候选集的快速召回,从不同角度设计的策略保证召回率接近理想的状态,不至于损伤排序效果。对于不同的业务,要考虑不同的召回规则。工具函数作为数据处理的前置准备获取用户-文章-时间函数:基于关联规则的用户协同过滤的时候会用到# 根据点击时间获取用户的点击文章序列 {user1: {item1: time1, item2: time2..}...}de原创 2020-11-30 22:51:04 · 253 阅读 · 0 评论 -
天池推荐系统数据分析
推荐系统数据分析<天池推荐系统比赛记录>本次任务的主要目标是查看数据集整个数据集中有哪些数据,这些数据中有什么潜在的关联,数据有怎样的特征,要如何对数据进行处理来服务于本次的醒悟推荐系统。数据分析的一般步骤导入数据%matplotlib inlineimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsplt.rc('font', family='S原创 2020-11-27 22:28:49 · 648 阅读 · 0 评论 -
天池推荐系统赛题理解与Baseline
推荐系统赛题理解与Baseline推荐系统概述更具用户信息给用户推荐商品,本质上是一种实现将用户-商品-公司之间利益最大化的手段。评测指标:用户满意度,覆盖率,多样性,新颖性,AUC曲线等。召回:召回阶段负责将海量的候选集快速缩小为几万到几千的规模,利用少量的特征和简单的模型对大规模的数据集进行快速的筛选,Embedding召回是一个综合性强且计算速度也能满足需求的召回方法。本次赛题目标: 根据用户历史浏览点击新闻的数据信息预测用户最后一次点击的新闻文章。提交形式:user1, artic原创 2020-11-25 21:53:09 · 289 阅读 · 0 评论