推荐系统
文章平均质量分 86
甘霖那
这个作者很懒,什么都没留下…
展开
-
推荐系统笔记(十七):对超图、超图卷积、超图注意力的初步理解和应用(HyperGCN)
对于我们熟悉的图而言,它的一个边(edge)只能和两个顶点连接;而对于超图来讲,它的边(这里叫超边,hyperedge)可以和任意个数的顶点连接。每个边所包含的顶点个数都是相同且为k个的,就可以被称为k阶超图。2阶超图就是我们平时所见到的图,因为我们平时的图由线条(edge,边)和点(vertice,顶点)构成,每条线都只包含两个点,所以这是符合2阶超图的定义的。超边的构建,将具有同一个属性的样本归到同一条超边里。原创 2022-08-19 18:52:09 · 12406 阅读 · 1 评论 -
推荐系统笔记(十六):推荐系统图协同过滤的深入理解:GDE
1)作者研究了GCN的特征表示的主贡献部分是rough和smooth部分的特征,因此用超图分别卷积user和item,进行特征提取。(卷积又分为只用特征值最大的和特征值最小的一部分(看作两个卷积核),卷积核的参数可以动态学习也可以用函数映射特征值)。(2)作者在本文的出发点是GCN本身,通过频域分析,证实了GCN其实是针对局部进行卷积,设计了多层的频率响应,而本文则只使用一层进行卷积,反而达到卷积到更远的视野的目的。...原创 2022-08-18 19:26:55 · 2003 阅读 · 0 评论 -
推荐系统笔记(十五):pytorch/tensorflow添加随机均匀噪声
其中的random_noise就是生成的噪声,self.eps是噪声占比,是一个超参数,可以任意调节,uniform代表的是tensorflow中的内置均匀分布函数,而l2_normalize是functional中的内置L2正则化或者说归一化函数。uniform_代表的是torch中的内置均匀分布函数,而normalize是functional中的内置归一化函数,其参数p=2代表L2正则化,dim等于1表示在行上操作归一化。......原创 2022-08-18 01:21:40 · 3932 阅读 · 1 评论 -
推荐系统笔记(十四):极简图对比学习方法SimGCL
1)在基于CL的推荐模型中,CL的损失是核心,而图的增强只起次要作用。(2)优化CL损失可以得到更均匀的表示分布,能在推荐的场景中帮助消除偏差。(3)通过在表示中加入有向随机噪声,进行不同的数据增强和对比,可以显著提高推荐能力。...原创 2022-08-18 01:09:13 · 1981 阅读 · 1 评论 -
推荐系统笔记(十三):SGL算法的代码实现
本算法是在LightGCN的代码上的基础实现的,LightGCN的代码和原理参考我前面几篇的博客:推荐系统笔记(六):LightGCN代码实现_甘霖那的博客-CSDN博客 由于LightGCN等传统基于图神经网络的算法有以下局限性: (1)高度节点对表征学习的影响更大,低度(长尾)节点的推荐效果更差; (2)表示容易受到噪声交互的影响,因为邻域聚合方案进一步扩大了观察到的边的影响。 (3)目前大多数推荐学习任务都是基于监督学习的范式,其中监督信号一般指用原创 2022-08-03 20:27:32 · 1866 阅读 · 5 评论 -
推荐系统笔记(十二):常用激活函数gelu、swish等
gelu就是高斯误差线性单元,这种激活函数在激活中加入了随机正则的思想,是一种对神经元输入的概率描述。为了方便记忆,这里做简要的笔记。汇总有:Identity、Sigmoid、TanH、Softmax、Softsign、Softplus、ReLU、Leaky ReLU、Randomized ReLU、SELU、GELU。其中在推荐系统的lightGCN中取消使用非线性激活函数。...原创 2022-08-03 19:57:12 · 4052 阅读 · 2 评论 -
推荐系统笔记(十一):使用coo_matrix函数遇到的坑
coo_matrix使用方法。当尝试索引coo_matrix的时候就会发生以上错误,原因是稀疏矩阵coo_matrix不直接支持切片操作。切片操作本质上是根据一系列下标索引来获取元素。所以稀疏矩阵coo_matrix不直接支持根据下标索引来获...原创 2022-08-02 20:26:01 · 1428 阅读 · 0 评论 -
推荐系统笔记(十):InfoNCE Loss 损失函数
InfoNCELoss是为了将N个样本分到K个类中,K原创 2022-07-30 19:41:04 · 31931 阅读 · 2 评论 -
推荐系统笔记(九):SGL --利用自监督对比学习缓解推荐系统长尾效应
SGL是模型不可知框架,采用用户项图上的自监督学习来弥补数据集稀疏和噪声影响的不足。论文中通过实验证明了SGL长尾推荐、训练收敛和抗噪声交互鲁棒性方面的优势。原创 2022-07-30 13:52:44 · 2820 阅读 · 0 评论 -
推荐系统笔记(八):推荐系统中的长尾效应
目前的推荐系统或者推荐算法,很难发现用户的隐性需求,需要调整长尾效应中商品推荐的比重,以避免或者降低长尾效应对用户体验的影响。原创 2022-07-30 10:35:07 · 3003 阅读 · 0 评论 -
推荐系统笔记(七):自监督学习、对比学习的理解
对比学习应用广泛,可以被使用于CV、推荐系统、自然语言处理等多个领域之中,可以有效解决标记数据不足的网络训练困难、不准确的问题。httpshttpshttpshttpshttps。原创 2022-07-30 01:22:56 · 3366 阅读 · 0 评论 -
推荐系统笔记(六):LightGCN代码实现
推荐系统笔记(五)lightGCN算法原理与背景_甘霖那的博客-CSDN博客。原创 2022-07-30 00:33:32 · 4351 阅读 · 2 评论 -
推荐系统笔记(四):NGCF推荐算法理解
首先就是将i4、i5、i2三个物品的信息聚合到u2中,(其实在这个聚合过程进行的同时其他结点也都进行了相应的聚合邻接结点信息,例如在此时u1也聚合了i1、i2、i3的信息),然后用u1和u2继续传播聚合给i2(此时i2结点在此时已经包含图三所有结点的信息),然后再将i1、i2、i3信息给u1。从早期的矩阵分解到最近出现的基于深度学习的方法,现有的工作通常通过从描述用户(或项目)的预先存在的特征(例如ID和属性)映射来获得用户(或项目)的嵌入。,即所谓的自信息(这在lightGCN中被证明是不必要的冗余)。.原创 2022-07-29 19:00:30 · 4323 阅读 · 0 评论 -
推荐系统笔记(五):lightGCN算法原理与背景
lightGCN是将图卷积神经网络应用于推荐系统当中,是对神经图协同过滤(NGCF)算法的优化和改进。lightGCN相比于其对照算法提升了16%左右,在介绍lightGCN之前应该知道NGCF的基本原理。 首先,协同过滤的基本假设是相似的用户会对物品展现出相似的偏好,自从全面进入深度学习领域之后,一般主要是先在隐空间中学习关于user和item的embedding,然后重建两者的交互即interaction modeling,如MF做内积,NCF模拟高阶交互等。但是他们并没有把u原创 2022-07-29 18:50:54 · 14483 阅读 · 5 评论 -
推荐系统笔记(三):NDCG Loss原理及其实现
为了做一个归一化数据,我们在检索的时候,可能返回的数据有很多条,累加的数目不一样,无法对两个搜索模型进行比较,就行在缓存中,当缓存行分别有10条和20条,他们的DCG之和不具有可比性,需要归一化才能定性的比较,这就是NDCG的主要思想。......原创 2022-07-29 10:50:51 · 2392 阅读 · 0 评论 -
推荐系统笔记(二):常用数据集Movielens学习
movielens数据集是电影推荐数据集,数据集有多种大小和目的使用的数据集。按照使用目的可以分为两类,一类数据集适用于推进最新研究的数据,一类数据集是用于高校研究和教育科研使用的数据集。本次介绍三个数据集的使用和处理。......原创 2022-07-28 20:24:01 · 7649 阅读 · 3 评论 -
推荐系统笔记(一):BPR Loss个性化推荐
在常规的推荐系统统计算法中,我们通常是通过现有数据集去计算获取用户对所有商品的得分,但大多情况下我们只需要关系极少数的商品的优先级,而不是所有的商品的排序,并且一些基于矩阵分解和KNN的推荐算法,是没有对排序方法进行优化的,而BPR损失函数能够满足我们的需求。(1)BPR的出发点是优化用户对商品的偏好排序,这使得它可以和其他推荐系统方法合并使用。(2)通过用户商品评分矩阵的分解实现类似于embedding的操作,从而获取用户的隐式评分。(3)通过贝叶斯最大后验概率估计进行参数学习。......原创 2022-07-26 10:29:50 · 12337 阅读 · 2 评论