传统推荐算法(五) FFM模型(1) 逻辑回归损失函数

最新推荐文章于 2024-05-12 11:46:23 发布

如雨星空

最新推荐文章于 2024-05-12 11:46:23 发布

阅读量755

点赞数

分类专栏：推荐系统传统的推荐算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xxiaobaib/article/details/97692966

版权

推荐系统同时被 2 个专栏收录

13 篇文章 1 订阅

订阅专栏

传统的推荐算法

10 篇文章 5 订阅

订阅专栏

文章目录

- 公众号

1. 逻辑回归

逻辑回归使用回归手段来做分类问题(主要是二分类).它使用sigmoid函数减小预测范围,将线性回归的结果限定在(0,1)之间,并将其作为条件概率进行建模.[1]中解释了为什么这么做是合理的.对于单个样本,逻辑回归的构造函数为:

]

也就是给出了线性参数和x的条件概率函数.也就是似然概率函数.显然,在给定Θ和x后,y=1的概率和y=0的概率为:

2. y(1,0) 逻辑回归损失

已知单个样本的似然概率,如何求解逻辑回归参数呢?在统计学中,常用最大似然估计来求解模型参数.

首先,单个样本的似然度可以简化为:

因此所有样本的似然度:

最大似然估计,就是极大化似然度,这种乘积形式直接作为损失函数梯度下降不方便,因此逻辑采用对数函数转化为对数似然函数:

最大似然估计就是求使l(Θ)最大的Θ,这里可以使用梯度上升方法来求解.

但机器学习中常用损失函数的概念来求解.因此长采用如下形式,将似然度转化为损失函数:

损失函数肯定要最小化,这里就要换成梯度下降方法来求解.

即上述过程也可以先求单个样本的对数损失,然后求和,都是一样的:

我们可以发现,只要求出了似然度,有两种方法写法可以得到逻辑损失函数.第一种是先求整体似然函数然后转整体损失函数,第二种直接由单样本似然度求单个样本损失,然后求和.

3. y(-1,-1) 逻辑回归损失

通过上一节我们知道了逻辑回归常用的损失函数的形式.这一节分析下另一种形式.

首先看给定w和x后,y=1和y=-1的似然概率:

这个似然度同样可以合成一个式子:

由最大似然度损失就不再一步步推导了,两种写法都可以推导,结论一目了然:

这个似然度也可以这样进一步简化:

这样写比上面那个好推多了,损失函数一步到位:

[1] https://tech.meituan.com/2015/05/08/intro-to-logistic-regression.html
[2] https://blog.csdn.net/pakko/article/details/37878837
[3] https://www.cnblogs.com/sparkwen/p/3441197.html
[4] https://blog.csdn.net/hualinchangfeng/article/details/78606658
[5] https://www.csie.ntu.edu.tw/~r01922136/slides/ffm.pdf

公众号

更多精彩内容请移步公众号:推荐算法工程师

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
传统推荐算法(五) FFM模型(1) 逻辑回归损失函数

文章目录1. 逻辑回归2. y(1,0) 逻辑回归损失3. y(-1,-1) 逻辑回归损失公众号1. 逻辑回归逻辑回归使用回归手段来做分类问题(主要是二分类).它使用sigmoid函数减小预测范围,将线性回归的结果限定在(0,1)之间,并将其作为条件概率进行建模.[1]中解释了为什么这么做是合理的.对于单个样本,逻辑回归的构造函数为:]也就是给出了线性参数和x的条件概率函数.也就是似然概率...
复制链接

扫一扫

专栏目录

如雨星空 CSDN认证博客专家 CSDN认证企业博客

码龄9年

156: 原创

5万+: 周排名

146万+: 总排名

23万+: 访问

: 等级

4021: 积分

94: 粉丝

175: 获赞

50: 评论

516: 收藏

私信

关注

热门文章

分类专栏

最新评论

基于深度学习的推荐(一)：神经协同过滤NCF
opportunity_362: 想请教一下，为什么预训练会报错啊输入python NeuMF.py --dataset ml-1m --epochs 3 --batch_size 256 --num_factors 8 --layers [64,32,16,8] --num_neg 4 --lr 0.001 --learner adam --verbose 1 --out 1 --mf_pretrain Pretrain/ml-1m_GMF_8_1501651698.h5 --mlp_pretrain Pretrain/ml-1m_MLP_[64,32,16,8]_1501652038.h5 然后报错：使用预训练的GMF和MLP模型权重来初始化NeuMF模型时遇到了错误。错误信息表明，在尝试加载预训练权重时，模型的形状不匹配。具体来说，预训练的GMF模型的权重形状是[6040, 8]，这意味着它预期用户数量为6040，而预训练的MLP模型的权重形状是[3706, 8]，意味着它预期物品数量为3706。
基于深度学习的推荐(一)：神经协同过滤NCF
Free Lazyer: 想请问下HR的计算中，博主说从100个数据集中取前K，这个100在代码中怎么体现的呢？我看代码中就直接对所有评分排序了啊？
二叉树--字典树应用--Hardwood Species
.柚不幼.love.: 大佬二叉搜索树不用指针咋写啊
scanf("%c")和getchar
Marksky126.: 写的很好！
基于深度学习的推荐(一)：神经协同过滤NCF
如雨星空: MF_Embedding_User可以理解为一个embedding矩阵 user_latent = (MF_Embedding_User(user_input))可以理解为根据user的下标去矩阵中查询对应的embedding user_latent = Flatten()(MF_Embedding_User(user_input))就是把查到的embedding压平为一个向量，应该是一维的吧，可以print下看看它的shape（其实如果查到的embedding已经是一个向量，这个Flatten应该是可以去掉的）从代码中看，是每次只输入一个user和item下标，查到embedding后进行multiply得到预测值，但这只是网络的结构定义。实际训练肯定是所有的数据都要过一遍这个操作，可以看看model.fit里面具体怎么实现这个过程的。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。