Deconfounded Recommendation for Alleviating Bias Amplification个人理解

最新推荐文章于 2024-07-06 11:42:20 发布

1746104160

最新推荐文章于 2024-07-06 11:42:20 发布

阅读量545

点赞数

文章标签：机器学习概率论人工智能神经网络推荐系统

本文链接：https://blog.csdn.net/qq_42856273/article/details/120721503

版权

Deconfounded Recommendation for Alleviating Bias Amplification

实际中用户历史信息D、用户U、用户对不同类型I的表现M、物品I、预测结果Y的因果图，存在两条后门路径
U<-D->M->Y
M<-U->Y
我们需要矫正的是对U的embedding，因此不需要考虑M中介的问题（第二条后门路径）。对于第一条后门路径，可以阻断D->U或者D->M，但是M需要经由U和D来计算，其取值难以估计，不方便阻断，因此最简单的切断这条后门路径的方式是阻断D->U

符号	解释
$u=[u_1,...,u_K],u_K \in \R^H$	用户
$x=[x_{u,1},...,x_{u,K}]$	用户特征
$d_u=[p_u(g_1),...,p_u(g_N)]$	用户历史上对某一类型I的倾向性
$m=M(d,u)\in \R^H$	用户基于历史交互的组特征
$\mathcal{H}_u$	交互记录的I的集合
$q^i=[q_{g_1}^i,...,q_{g_n}^i]\in \R^H$	I属于每个组的概率
$v=[v_1,...,v_N],v_N\in \R^H$	组的特征

$\begin{aligned} P&(Y|U=\mathbf{u},I=\mathbf{i}) \\ &=\frac{\textstyle \sum_{\mathbf{d} \in D} \sum_{\mathbf{m} \in M}P(\mathbf{d})P(\mathbf{u}|\mathbf{d})P(\mathbf{m}|\mathbf{d},\mathbf{u})P(\mathbf{i})P(Y|\mathbf{u},\mathbf{i},\mathbf{m})}{P(\mathbf{u})P(\mathbf{i})} \\ &=\textstyle \sum_{\mathbf{d} \in D} \sum_{\mathbf{m} \in M}P(\mathbf{d}|\mathbf{u})P(\mathbf{m}|\mathbf{d},\mathbf{u})P(Y|\mathbf{u},\mathbf{i},\mathbf{m})\\ &=\textstyle \sum_{\mathbf{d} \in D}P(\mathbf{d}|\mathbf{u})P(Y|\mathbf{u},\mathbf{i},M(\mathbf{d},\mathbf{u}))\\ &=P(\mathbf{d}_u|\mathbf{u})P(Y|\mathbf{u},\mathbf{i},M(\mathbf{d}_u,\mathbf{u}))\\ P&(Y|do(U=\mathbf{u}),I=\mathbf{i}) \\ & = \displaystyle \sum_{\mathbf{d} \in \mathcal{D} }P(\mathbf{d}|do(U=u))P(Y|do(U=\mathbf{u}),\mathbf{i},M(\mathbf{d},do(U=\mathbf{u}))) \\ & = \displaystyle \sum_{\mathbf{d} \in \mathcal{D} }P(\mathbf{d})P(Y|do(U=\mathbf{u}),\mathbf{i},M(\mathbf{d},do(U=\mathbf{u})))\\ & = \displaystyle \sum_{\mathbf{d} \in \mathcal{D} }P(\mathbf{d})P(Y|\mathbf{u},\mathbf{i},M(\mathbf{d},\mathbf{u})) \end{aligned}$
由于D的范围是无限的,对上面应用后门准则计算后的公式进行优化，只考虑交互过的D
$p_u(g_n)=\displaystyle \sum_{i \in I}p(g_n|i)p(i|u)=\frac{\sum_{i \in \mathcal{H}u}q{g_n}^i}{|\mathcal{H}_u|} $
$\begin{aligned} P&(Y|do(U=\mathbf{u}),I=\mathbf{i}) \\ & = \displaystyle \sum_{\mathbf{d} \in \mathcal{D} }P(\mathbf{d})P(Y|\mathbf{u},\mathbf{i},M(\mathbf{d},\mathbf{u})) \\ & \approx \displaystyle \sum_{\mathbf{d} \in \mathcal{D} }P(\mathbf{d})f(\mathbf{u},\mathbf{i},M(\mathbf{d},\mathbf{u})) \\ & = f(\mathbf{u},\mathbf{i},M(\displaystyle \sum_{\mathbf{d} \in \mathcal{D}}P(\mathbf{d})\mathbf{d},\mathbf{u})) \\ & = f(\mathbf{u},\mathbf{i},M(\bar{\mathbf{d}},\mathbf{u})) \\ \end{aligned}$
可以利用FM来求解 $M(\bar{\mathbf{d}},\mathbf{u})$
$\begin{aligned} M(\bar{\mathbf{d}},\mathbf{u}) & = \displaystyle \sum_{a=1}^N\displaystyle \sum_{b=1}^Kp(g_a)v_a\odot x_{u,b}\mathbf{u}_b\\ & =\displaystyle \sum_{a=1}^{N+K}\displaystyle \sum_{b=1}^{N+K}w_a\mathbf{c}_a\odot w_b\mathbf{c}_b \end{aligned}$
其中
$\begin{aligned} \mathbf{w}&=[\bar{\mathbf{d}},\mathbf{x}_u] \\ \mathbf{c}&=[\mathbf{v},\mathbf{u}] \end{aligned}$

根据timestamp信息分为两组，运用KL分歧对用户的兴趣变化进行量化。将普通推荐系统模型与融入了去处混杂因子的模型预测结果进行融合
$\begin{aligned} \eta_u&=𝐾𝐿(d_u^1|d_u^2)+𝐾𝐿(d_u^2|d_u^1) \\ &=\displaystyle \sum_{n=1}^NP_u^1(g_n)\frac{P_u^1(g_n)}{P_u^2(g_n)}+\displaystyle \sum_{n=1}^NP_u^2(g_n)\frac{P_u^2(g_n)}{P_u^1(g_n)}\\ Y_{u,i}&=(1-\hat{\eta}_u)*Y_{u,i}^{RS}+\hat{\eta}_u*Y_{u,i}^{DECRS} \end{aligned}$
其中(MinMaxScaler一下权重的超参数)
$\hat{\eta}_u=(\frac{\eta_u-\eta_{min}}{\eta_{max}-\eta_{min}})^\alpha$

1746104160

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Deconfounded Recommendation for Alleviating Bias Amplification个人理解

Deconfounded Recommendation for Alleviating Bias Amplification#mermaid-svg-05exCPtIQaxKShuj .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-05exCPtIQaxKShuj .label text{fill:#333}#
复制链接

扫一扫