推荐系统系列:NFM模型理论和代码实现

一、前言

发表于2017年的推荐类文章,主要采用的是串行结构即将FM中的一次项和二次项结果输入给DNN部分,典型的串行结构还包括PNN和AFM等都会在接下来进行介绍,本文的论文地址为:https://arxiv.org/pdf/1708.05027.pdf

二、算法原理

(1)模型的整体框架如图所示:主要包含输入的embedding,其次是一个Bi-Interaction Pooling层,随后是一个DNN部分对结果进行预测;

(2)首先介绍Bi-Interaction Pooling,这一部分主要是采用的哈达玛积;

如论文中所述:哈达玛积的相乘方式如下公式;

随后通过化简可以得到:

(3)随后经过一个DNN部分可以得到如下的结果:

(4)总结一下所有的,可以将整个过程表示为如下公式所述,其实还是很简单的;

三、实验效果

四、代码实现

代码部分只实现比较核心(Bi-Interaction Pooling)的部分,其他部分的地方需要自己补充,这里总感觉和FM很相似;主要区别就是这里的输出直接连接的是DNN,所以是串行结构和并行结构还是有区别的;

from tensorflow.python.keras.layers import Layer
import tensorflow as tf

class bi_interaction(Layer):
    def __init__(self, **kwargs):
        super(bi_interaction, self).__init__(**kwargs)
    
    def build(self, input_shape):
        super(bi_interaction, self).build(input_shape)
    
    def call(self, inputs):
        concat_embed_value = inputs
        square_of_sum = tf.square(tf.reduce_sum(concat_embed_value, axis=1, keep_dims=True))
        sum_of_square = tf.reduce_sum(concat_embed_value * concat_embed_value, axis=1, keep_dims=True)
        cross = 0.5 * (square_of_sum - sum_of_square)
        return cross#(batch , 1, embed_size)

 

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是基于PyTorch实现NFM推荐算法代码,供参考: ``` import torch import torch.nn as nn import torch.nn.functional as F class NFM(nn.Module): def __init__(self, feature_dim, embedding_dim, hidden_dim, output_dim, dropout_prob): super().__init__() self.feature_dim = feature_dim self.embedding_dim = embedding_dim self.hidden_dim = hidden_dim self.output_dim = output_dim self.dropout_prob = dropout_prob self.embedding = nn.Embedding(feature_dim, embedding_dim) self.linear1 = nn.Linear(embedding_dim, hidden_dim) self.linear2 = nn.Linear(hidden_dim, output_dim) self.linear3 = nn.Linear(embedding_dim, output_dim) self.dropout = nn.Dropout(dropout_prob) def forward(self, x): # Embedding layer x_emb = self.embedding(x) # Bi-Interaction layer sum_square = torch.sum(x_emb, dim=1) ** 2 square_sum = torch.sum(x_emb ** 2, dim=1) bi_interaction = 0.5 * (sum_square - square_sum) # MLP layer mlp_output = F.relu(self.linear1(self.dropout(bi_interaction))) mlp_output = self.linear2(self.dropout(mlp_output)) # Output layer output = self.linear3(x_emb.mean(dim=1)) + mlp_output return output ``` 其中,`feature_dim`为特征维度,`embedding_dim`为嵌入维度,`hidden_dim`为隐层维度,`output_dim`为输出维度,`dropout_prob`为dropout概率。 在模型的前向传播过程中,首先通过`nn.Embedding`层将输入的离散特征转化为嵌入向量,然后通过Bi-Interaction Layer计算二阶交叉特征,再通过MLP Layer进行非线性变换,最后将MLP输出和原始嵌入向量的平均值相加得到最终输出。 使用时,可以像以下代码一样初始化并训练模型: ``` # 初始化模型 model = NFM(feature_dim, embedding_dim, hidden_dim, output_dim, dropout_prob) # 定义损失函数和优化器 criterion = nn.BCEWithLogitsLoss() optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate) # 训练模型 for epoch in range(num_epochs): for inputs, targets in dataloader: optimizer.zero_grad() outputs = model(inputs) loss = criterion(outputs, targets) loss.backward() optimizer.step() ``` 其中,`feature_dim`、`embedding_dim`、`hidden_dim`、`output_dim`、`dropout_prob`、`learning_rate`、`num_epochs`等参数需要根据具体情况进行设置,`dataloader`是一个PyTorch的`DataLoader`对象,用于加载训练数据。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值