FNN学习笔记

最新推荐文章于 2025-02-06 12:27:48 发布

饕子

最新推荐文章于 2025-02-06 12:27:48 发布

阅读量323

点赞数

分类专栏：机器学习文章标签：学习笔记深度学习

本文链接：https://blog.csdn.net/m0_72410588/article/details/130553757

版权

机器学习专栏收录该内容

85 篇文章

订阅专栏

FNN学习笔记

一. 前言

FNN（Factorization Neural Network）是一种组合了FM（Factorization Machine）和多层感知机（Multilayer Perceptron，MLP）的混合模型。它通过利用 FM 的特性对高维稀疏数据进行特征组合，再通过 MLP 处理组合后的特征，从而得到更优的预测结果。

本文将对 FNN 进行详细介绍，包括模型结构、损失函数、训练方法等。

二. 模型结构

FNN 的模型结构如下图所示：

graph LR
    A[Input] -- Embedding --> B[FM layer] -- Concatenate --> C[MLP layer] -- Output --> D[Output]

其中，模型由三部分组成：

Input layer：输入层，接收原始特征向量。
FM layer：FM 层，将输入向量进行特征交叉操作，并输出特征交叉向量。
MLP layer：MLP 层，接收 FM 层输出的特征交叉向量，并输出最终预测结果。

三. 损失函数

FNN 的损失函数采用的是交叉熵损失函数，具体如下式所示：

$Loss=-\frac{1}{N}\sum_{i=1}^{N}(y_i log(\hat{y_i})+(1-y_i)log(1-\hat{y_i}))$

其中， $y_i$ 为样本 $i$ 的真实标签值， $\hat{y_i}$ 为样本 $i$ 的预测标签值。

四. 训练方法

FNN 的训练方法采用的是 mini-batch SGD（Stochastic Gradient Descent），具体流程如下：

在每个 epoch 开始时，将训练数据随机分为若干个 batch。
对于每个 batch，依次进行以下操作：
- 将 batch 中的所有样本输入模型，得到预测结果。
- 计算该 batch 的交叉熵损失函数，并累加至总损失函数。
- 计算损失函数关于参数的梯度，并更新参数。
在所有 batch 都处理完后，计算该 epoch 的平均损失函数，并将其存入日志文件中。
当达到最大 epoch 数或者满足早停条件时，结束训练。