自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 【情感计算翻译】

原文链接:Deep Emotional Arousal Network for Multimodal Sentiment Analysis and Emotion Recognition - ScienceDirectDeep Emotional Arousal Network for Multimodal Sentiment Analysis and Emotion Recognition——用于多模态情感分析和情绪识别的深度情感唤醒网络【摘要】 多模态情感分析和情感识别已成为一个日益

2023-11-22 09:53:42 110

原创 【情感计算翻译】EASE:Robust Facial Expression Recognition via Emotion Ambiguity-SEnsitive Cooperative Networ

面部表情识别 (FER) 在实际应用中起着至关重要的作用。然而,在野外收集的大规模FER数据集通常包含噪声。更重要的是,由于情绪的模糊性,具有多种情绪的面部图像很难与带有嘈杂标签的面部图像区分开来。因此,为 FER 训练鲁棒模型具有挑战性。为了解决这个问题,我们提出了包含两个组成部分的情感模糊性-SEnsitive 合作网络(EASE)。首先,歧义敏感学习模块将训练样本分为三组。两个网络中损耗较小的样本被认为是干净的样本,而损耗较大的样本则是噪声。

2023-11-16 17:15:21 140

原创 【情感计算翻译】ViPER: Video-based Perceiver for Emotion Recognition

从视频中识别人类情感需要深入了解潜在的多模态源,包括图像、音频和文本。由于输入数据源在不同模态组合中变化很大,因此利用多种模态通常需要临时融合网络。为了预测一个人对给定视频剪辑的反应的情绪唤醒,我们提出了ViPER,这是一种多模态架构,利用基于模态不可知的转换器模型来组合视频帧,录音和文本注释。具体来说,它依赖于与模态无关的晚期聚变网络,这使得ViPER很容易适应不同的模态。在MuSe-Reaction挑战的HumeReaction数据集上进行的实验证实了所提方法的有效性。

2023-10-26 11:03:27 254 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除