【菜鸡读论文】Former-DFER: Dynamic Facial Expression Recognition Transformer

Former-DFER: Dynamic Facial Expression Recognition Transformer

哈喽,大家好呀!本菜鸡又来读论文啦!先来个酷炫小叮当作为我们的开场!
粉红爱心泡泡有没有击中你的少女心!看到这么可爱的小叮当陪我们一起读论文,是不是感觉瞬间充满动力了呢!突然想到下次确实可以搞一个漂亮妹妹的动图,让漂亮妹妹陪我们一起读论文,不知道大家有没有什么好建议呢!
在这里插入图片描述不知不觉!今天竟然是冬至了!感觉时间真的过得好快,在我们老家,冬至应该吃饺子,不过我也是突然想起来这回事,因为我早上起的太晚了,竟然睡到快11点才醒。其实,我最近有点失眠,就很害怕早上起来看到手机时间才六点或七点这样,因为这样的话,我就要接着努力去睡觉,没想到今天早上起来竟然已经快11点了,感觉像是另一种惊吓。

昨天晚上看了一部电影《伊甸湖》,后劲儿还挺大的,差不多八点看完,结果一直难受到十点多,真的太让人难受了。如果没有看过这部电影的小朋友可以去看一看,真的挺不一样的,我是第一次看这种题材,后来发现竟然还是真实故事改变,更难受了。好像还有一些同类型的电影,不过我应该要再缓缓才能接着看别的电影了。
话不多说,让我们在小叮当的陪伴下,来看今天的论文:

在这里插入图片描述在现实生活中的表情序列识别存在一些挑战,比如遮挡、非额叶姿势和头部运动。如下图:

在这里插入图片描述
基于这些问题,作者提出dynamic facial expression recognition transformer(Former-DFER)。Transformer的自注意力机制可以学习到区域面部特征的相关性以及时间上面部特征之间的相关性,具有处理以上挑战的能力。(哦对了!这篇论文还有github代码,我也去跑了一下,可以跑出来,大家放心去试)
下面,让我们来看一下这个模型的架构图,可以看到这个模型包括两个部分(绿色和蓝色)
1、convolutional spatial transformer(CS-former)
CS-former由五个卷积块和N个空间编码器组成,旨在引导网络从空间角度学习遮挡和姿态稳健的面部特征。
2、temporal transformer(T-former)
T-former由M个时间编码器组成,旨在允许网络从时间的角度学习上下文的面部特征。
在这里插入图片描述
接下来我们详细来看这两个模块的细节

CS-Former

CS-former由五个卷积块和N个Spatial Encoder组成

在这里插入图片描述
输入:首先把视频序列分成U段,接下来从每段序列中间取V帧,最终共输入U*V帧
输入帧首先通过四个卷积块来提取特征映射图,接下来将一个通道数为C的特征映射图组在通道维度上拉成一组序列,如上图所示,加上位置嵌入后,送入编码器,自注意机制的计算如下所示:

在这里插入图片描述在这里插入图片描述
可以将四个卷积块的作用看做是提取局部特征,Spatial Encoder用于提取全局特征,可以看到从Spatial Encoder出来之后又连上一个卷积块,该卷积块的作用相当于对特征进行提炼。

T-Former

每一帧经过CS-Former都会得到一个特征表示,一组帧经过CS-Former会得到一个序列,为了最后的分类,我们增加一个Class Token,如图所示。接下来,加上一个Temporal Positional Embedding来表示时间顺序。

在这里插入图片描述Temporal Encoder的计算流程,如下所示:
在这里插入图片描述
在这里插入图片描述
整个模型就是这样,接下来就是实验部分了,放上一些实验结果图:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
滚动条出现的原因可能是由于设置了box-sizing: border-box;后,元素的宽度超过了其父容器的宽度。引用中提到的情况可能是因为在侧边栏收起时,元素的宽度变小,而父容器的宽度没有相应地调整,导致出现了横向滚动条。 解决这个问题的方法是给出现横向滚动条的那一层盒子元素设置overflow-x: hidden,即引用中提到的方法。这样可以隐藏横向滚动条,并确保元素在不改变父容器宽度的情况下适应其内部内容的宽度。 此外,还需要注意引用中提到的框的总宽度计算方式,即width + padding-right + padding-left + border-right + border-left。如果在元素的宽度计算中没有正确考虑这些属性,也可能导致滚动条的出现。 综上所述,设置了box-sizing: border-box;并不保证完全避免滚动条的出现,还需要确保元素的宽度不超过其父容器的宽度,并正确计算框的总宽度。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [一个box-sizing: border-box和felx混合使用中遇到的问题](https://blog.csdn.net/weixin_30251829/article/details/99976811)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [从box-sizing:border-box属性入手,来了解盒模型](https://blog.csdn.net/qq_26780317/article/details/80736514)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

猫头丁

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值