推荐系统
文章平均质量分 91
推荐系统模型相关
—Xi—
机器学习/数据挖掘/爬虫/推荐系统
展开
-
【零基础入门推荐系统 - 新闻推荐】1-数据分析-天池学习赛笔记
平均共现次数3.18,最高为2202,两篇新闻连续出现的概率算高,说明用户看的新闻上下相关性较强。从上图可以发现不同用户点击文章的时间差是有差异的,用户先后点击文章,文章的创建时间也是有差异的。由图知,偏好类型广泛的用户较少,大多数用户的偏好类型较少,在20个类型以下。这是一种简单的处理思路, 判断用户活跃度,更加全面的是再结合上点击时间,点击次数小于等于两次的用户非常的多,这些用户可以认为是非活跃用户。'''点击次数最多的前20篇新闻,点击次数大于2500。此特征可以用于度量用户的兴趣是否广泛。原创 2022-10-14 15:45:41 · 1210 阅读 · 0 评论 -
【推荐系统】推荐系统-基础算法 冷启动、及深度学习在冷启动上的应用
冷启动在推荐系统中表示该系统积累数据量过少,无法给新用户做个性化推荐的问题,这是产品推荐的一大难题。每个有推荐功能的产品都会遇到冷启动的问题。一方面,当新商品时上架也会遇到冷启动的问题,没有收集到任何一个用户对其浏览、点击或者购买的行为,也无从判断如何将商品进行推荐;另一方面,新用户到来的时候,如果没有他在应用上的行为数据,也无法预测其兴趣,如果给用户的推荐千篇一律,没有亮点,会使用户在一开始就对产品失去兴趣,从而放弃使用。所以在冷启动的时候要同时考虑用户的冷启动和物品的冷启动。原创 2022-09-05 10:22:58 · 1625 阅读 · 0 评论 -
【推荐系统】推荐基础算法-基于稀疏自编码的推荐方法
假设某个自编码神经网络的输入x是100维的数据,其隐藏层L2我们限定为50个隐藏神经元,输出也是100维的y由于只有50个隐藏神经元,我们迫使自编码神经网络去学习输入数据的压缩表示,也就是说,它必须从50维的隐藏神经元的激活项中重构出100维的输入。输入层,每首歌曲的输入向量为(u1,u2,u3,……隐藏层1、隐藏层2,强制指定神经元的数量为k+1个,此时隐藏层其实就是歌曲的低维特征向量,矩阵为(k+1)xn,k+1为特征维数(包含一个截距项1,之所以保留,是为了可以重构出输出层),其中n为歌曲数量。原创 2022-09-03 16:38:21 · 280 阅读 · 0 评论 -
【推荐系统】Embedding + MLP tensorflow特征处理 + 模型搭建实战 笔记
Embedding:将经过独热编码过后的类别型特征向量化从而生成稠密特征MLP:将稠密特征输入多层神经网络去拟合得到最优结果。原创 2022-09-14 16:32:37 · 1508 阅读 · 0 评论 -
【推荐系统】特征选择(单变量特征选择和基于模型的特征选择)
单变量特征选择能够对每一个特征进行测试,衡量该特征和响应变量之间的关系,根据得分丢弃不好的特征。单变量特征选择这种方法比较简单,易于运行,易于理解。原创 2022-09-15 17:01:36 · 1100 阅读 · 0 评论 -
【推荐系统】DeepFM模型
因子分解机(Factorization Machines, FM)通过对于每一维特征的隐变量内积来提取特征组合。虽然理论上来讲FM可以对高阶特征组合进行建模,但实际上因为计算复杂度的原因一般都只用到了二阶特征组合,对于更高阶的特征组合,可以用Deep解决。原创 2022-09-16 15:32:05 · 620 阅读 · 0 评论 -
【推荐系统】推荐系统基础算法-基于矩阵分解的推荐方法、隐语义模型
加载用户对物品的评分矩阵矩阵分解,求奇异值,根据奇异值的能量占比确定降维至k的数值使用矩阵分解对物品评分矩阵进行降维使用降维后的物品评分矩阵计算物品相似度,对用户未评分过得物品进行预测产生前n个评分值高的物品,返回物品编号以及预测评分值。原创 2022-09-02 15:57:53 · 1083 阅读 · 0 评论 -
【推荐系统】wide&deep模型、NeuralCF模型 笔记
Deep:DNN模型,提高模型的泛化能力。Wide:简单的广义线性模型,其特征组合需要人去设计,依赖人工特征工程。注重模型的记忆能力。原创 2022-09-16 12:07:00 · 629 阅读 · 0 评论 -
【推荐系统】推荐系统基础算法-基于协同的推荐算法
因此,基于内容的推荐往往会和其他方法混用,比如基于邻域的算法, 基于邻域的算法可以分为协同过滤算法具有速度快和准确率高两种特点。原创 2022-09-01 17:22:40 · 1786 阅读 · 0 评论 -
【推荐系统】推荐系统-基础算法 基于社交网络的算法
社交网络形成两类社交网络结构,一类是好友一般都是自己在现实中认识的,这种好友关系需要双方确认,如qq空间,facebook,称之为社交图谱。另一种好友只是出于对对方的言论感兴趣而建立好友关系的,如微博,twitter。这种社交网络也被成为兴趣图谱。但任何一个社会化网站都不是单纯的社交图谱或兴趣图谱,在熟人网络如qq空间也会和部分好友有共同兴趣而在微博这种兴趣图谱社交网站中也可能会有现实生活中的亲朋好友.原创 2022-09-02 21:22:24 · 1743 阅读 · 0 评论 -
【推荐系统】特征处理
数据与特征决定了模型的上限,而模型算法则为逼近这个上限”。特征的本质为一项工程活动,目的是最大限度地从原始数据中提取特征以供算法模型使用。在实际构建推荐系统过程中,可以直接用于模型算法的特征并不多,能否从原始数据中挖掘出来有用的特征将会直接决定推荐系统的质量。对于特征一般的处理流程为特征获取、特征清洗、特征处理和特征监控,由于原始数据中的特征通常无法在算法模型中直接使用,需要经过特征转化与特征选择后放入模型。原创 2022-09-05 20:07:18 · 902 阅读 · 0 评论 -
【推荐系统】GBDT + LR模型 笔记
转载内容GBDT与传统的Boosting区别较大,它的每一次计算都是为了减少上一次的残差,而为了消除残差,我们可以在残差减小的梯度方向上建立模型,所以说,在GradientBoost中,的方法,与有着很大的区别。在GradientBoosting算法中,关键就是利用损失函数的负梯度方向在当前模型的值作为残差的近似值,进而拟合一棵CART回归树。原创 2022-09-15 12:54:25 · 670 阅读 · 0 评论 -
【推荐系统】推荐系统基础算法-基于内容的推荐算法
内容来自于书《推荐系统与深度学习》,黄昕,赵伟,王本友,吕慧伟,杨敏编著,清华大学出版社。原创 2022-08-31 16:04:50 · 1213 阅读 · 0 评论