Attention-based Multimodal Feature Representation Model for Micro-video Recommendation

“Attention-based Multimodal Feature Representation Model for Micro-video Recommendation” 基于注意力的多模态特征表征模型用于微视频推荐

  • Abtract

    在这方面,本文采用了一种自我关注的机制来挖掘特征之间的内部关联性以及它们的相对重要性。

  • Introduction

    例如,Zhang等人[1]利用微视频的文本、音频和视觉模态特征来解决多媒体场景分类问题。

    Wei等人[4]使用神经多模态合作学习(NMCL)来解决微视频场景分类的问题。

    本文提出了一种基于注意力的多模态特征融合方法,通过注意力机制为视频的各个模态分配不同的权重。为了保证学习到的各模态的权重能够反映用户的偏好,该方法将用户特征纳入注意力网络,实现视频各模态特征的个性化融合,从而提供更加个性化的视频推荐。

针对主要的微视频分类任务,通过建立相似性损失和差异性损失,探索微视频中不同模态的相似性和同一模态的差异性,得到视频中不同模态的私域特征和公域特征,并将其融合为全局特征,分类损失用于指导微视频的分类。

  • Related Work

    矩阵因子化模型(MF)[23]是基于模型的CF算法之一。MF的核心思想是通过隐性特征将用户兴趣和项目特征联系起来,将用户-项目矩阵分解为两个矩阵的乘积,即用户兴趣矩阵和项目属性矩阵。

    为了探索特征的交叉关系,Rendle[26]提出了因式分解机(Factorization Machines,FM),它可以自动将特征一分为二,从而挖掘特征间的隐含信息,提高模型的推荐性能。

    早期的视频特征提取方法使用二维卷积网络来学习视频中每一帧的特征,这是受图像处理的启发。

  • Methodology

    本文提出的特征表示模型有以下主要结构:输入层、嵌入层、MHSA层、AC层和输出层。

嵌入层:在嵌入层中,离散和稀疏的特征被嵌入,嵌入矩阵被用来降低维度,学习具有更多泛化的原始特征表示。

MASH层:其中,MHSA(Multi-Head-Self-Attention)层是一个基于多头自我关注的特征内部表示模块,它通过多头自我关注机制学习特征之间的内部关联性

AC层:多头方法 AC(Attention-Crossing)层是一个基于注意力的特征外部交叉表征模块,它通过多头自我注意机制来学习隐性特征描述,并通过注意力来学习特征交叉的重要性。

MHSA层和AC层得到的特征交叉表示进行加权求和,然后通过sigmoid函数得到输出结果。最终的输出结果表示为:
在这里插入图片描述

在这里插入图片描述

  • 特征提取

    为了提取微视频的视音频模态的时域信息,本文采用三维卷积网络,分别获得视音频模态的私域特征和视音频模态的公域特征。

  • 特征嵌入

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
深度学习在语义道路场景的多模态融合中的探索是一项研究任务,目的是通过结合多种视觉和感知模态的信息,提升对道路场景的语义理解能力。 在这个任务中,我们使用深度学习的方法来处理不同模态的数据,如图像、激光雷达和 GPS 等。我们首先将这些模态的数据进行预处理,将其转换为神经网络可以处理的格式。然后,我们构建深度神经网络模型,用于将这些模态的信息进行融合。这种融合可以是级联式的,也可以是并行式的,即同时处理多个模态,以充分利用不同模态数据之间的相关性。 在模型的训练过程中,我们使用大量的标注数据,将不同模态数据与其对应的语义标签进行匹配。通过反向传播算法,我们可以优化模型参数,使其能够准确地预测道路场景的语义信息。 深度学习的多模态融合方法在语义道路场景中有广泛的应用。通过结合不同模态的信息,我们可以更好地理解道路场景中的障碍物、车辆、行人等不同元素。这种融合方法还可以提高对不同道路环境的适应性,使得我们的模型在城市、乡村等不同场景中都能够有效地工作。 总之,深度学习的多模态融合方法对于道路场景的语义理解具有重要意义。通过结合多种视觉和感知模态的信息,我们可以提高对道路场景的认知能力,为自动驾驶、智能交通等领域的发展提供有力支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值