推荐系统
bwqiang
日日新。
展开
-
Embedding技术在深度学习推荐系统中的应用
Embedding译为“嵌入”,被翻译为“向量化”。主要作用:将稀疏向量转化为稠密向量,便于上层神经网络的处理。 定义:用一个低维稠密的向量“表示”一个对象。 对象可以是一个词,一个商品,一部电影等等。“表示”:意味着Embedding向量能够表达相应对象的某些特征,向量之间的距离,反应对象之间的相似性。 Embedding对深度学习推荐系统的重要性: 使用Embedding层将高维稀疏特征向量转换成低维稠密特征向量。 可以引入任何信息进行编码,本身包含大量有价值的信息。 Embedding对物品和用于相原创 2020-09-17 10:46:16 · 1331 阅读 · 2 评论 -
推荐系统总结(三)
基于GBDT+LR模型的用户购买商品的预测 上述两篇博文讨论了题目内容并对题目进行了简单的剖析,包括绘制了用户每日(小时)的不同操作数的柱状图和大概率基于某个时间T内用户对商品加购后并购买商品的预测并绘制柱状图。并对该数据集构建具有100个特征的特征工程,确保数据特征的充分性。这篇博文将从机器学习模型GBDT的角度出发,使用GBDT模型对用户在12月19日是否购买商品进行预测。 1、GBDT模型简介 GBDT(梯度提升决策树)是一种基于Gradient Boosting的策略训练出来的DT模型。其核原创 2020-08-21 00:40:43 · 594 阅读 · 0 评论 -
推荐系统总结(二)
1、建立特征工程 机器学习模型的能力边界在于对数据的拟合和 泛化,数据及表达数据的特征本身就决定了机器学习模型效果的上限,而模型和算法只是在逼近这个上限。因此,特征工程 对推荐系统效果提升的作用是无法替代的。 1.1 构建推荐系统特征工程的原则 推荐系统中,特征的本质就是对某个行为过程相关信息的抽象表达。推荐系统过程中的某个行为转换成某种数学形式才能被机器学习模型所学习。所以必须将这些行为过程中的信息以特征的形式抽取出来,用多个维度的特征去表达这一行为。 构建推荐系统特征工程的原则:尽可能地让特原创 2020-08-20 00:04:18 · 378 阅读 · 0 评论 -
推荐系统总结(一)
题目回顾 推荐系统数据集选自:天池新人实战赛之[离线赛]。 数据集内容 本场比赛提供20000用户的完整行为数据以及百万级的商品信息。竞赛数据包含两个部分。 第一部分是用户在商品全集上的移动端行为数据(D),表名为tianchi_fresh_comp_train_user_2w,包含如下字段: 第二个部分是商品子集(P),表名为tianchi_fresh_comp_train_item_2w,包含如下字段: 训练数据 :包含了抽样出来的一定量用户在一个月时间(11.18~12.18)原创 2020-08-18 16:27:33 · 465 阅读 · 0 评论 -
推荐系统的进化之路
推荐系统的发展:协同过滤(Collaboration Filtering, CF)、逻辑回归(LR)、因子分解机(Factorization Machine)、梯度提升树(GBDT)。 协同过滤 定义:协同大家的反馈、评价和意见一起对海量的信息进行过滤,从中筛选出目标用户可能感兴趣的信息的推荐过程。 用户相似度计算:这是算法中的关键一步。可以使用(1)余弦相似度(2)皮尔逊相关系数等来计算两个向量之间的相似度。 ItemCF:基于物品相似度进行推荐的协同过滤算法。具体步骤:(1)基于历史数据原创 2020-08-05 14:35:53 · 399 阅读 · 0 评论