近期调研


近期论文阅读重点放在视觉领域中卷积与TRM结合的工作。
这些工作的主要动机有两点:

  • 卷积操作的局部性阻碍对全局特征的捕获
  • TRM的self-attention机制用于长距离信息捕获已经被证明是一种很好的范式,但是其仍然存在一些问题,将在下文具体阐述。

[ICCV 2019] Attention Augmented Convolutional Networks

动机

卷积只对局部邻域运算,会丢失全局信息。

贡献

提出了Attention Augmentation method(注意增强方法),利用self-attention机制来增强卷积算子。将强调局部性的卷积特征映射与能够对较长范围的相关进行建模的self-attention特征映射连接起来。

方法

方法偏重与理论推导而非模型改变,但是具有很强的可借鉴意义。
可参考:Attention Augmented Convolutional Networks 笔记

[ICCV 2021] Conformer: Local Features Coupling Global Representations for Visual Recognition

动机

卷积难以捕捉global feature,self-attention机制可以捕捉长距离的特征信息,但会模糊前景和弱化局部信息。

贡献

  1. 提出双主干网络Conformer,最大程度上获取local和global feature
  2. 提出特征耦合单元FCU,以一种交互性的方式将两路网络获取的特征融合

方法

Conformer

  1. 卷积分支 CNN Branch
    卷积分支使用ResNet结构
  2. TRM分支 Transformer Branch
    TRM分支使用ViT结构
  3. 特征融合模块FCU Feature Coupling Unit(重点)
    除第一个Bottleneck外,每一个Bottleneck的3×3 conv输出的特征图进入到TRM分支进行feature fusion,FCU使用1×1卷积调整channel,使用down/up sampling调整H和W,BN和LN用于调整feature value,FCU被嵌入到网络的每个block中,更好地消除两种机制feature的语义差异。

[ICLR 2022] UniFormer: Unifying Convolution and Self-attention for Visual Recognition

动机

单一的CNN和TRM均不能解决当前视觉领域存在的问题,并且作者观察到,在浅层网络,即使通过self-attention计算全局的相似度实际关注的仍为相邻时空区域的关系。
即以往的ViT虽然使用全局的attention计算,但最终学习的多数仍是局部表征,造成大量冗余的计算。

贡献

基于以上的观察,作者提供了将CNN和TRM结合的全新结构

  1. 浅层网络仅关注有限窗口的信息(CNN模式),深层网络关注整体信息,全局信息聚合(TRM模式)
  2. 将convolution和self-attention统一于token关系的学习中,模型兼顾两种范式的长处

方法

Uniformer
模型整体借鉴CNN层次化设计,每层包含多个Transformer风格的UniFormer block。
uniformer block
每个UniFormer block主要由三部分组成,动态位置编码DPE、多头关系聚合器MHRA)及Transformer必备的前馈层FFN,其中最关键的为多头关系聚合器

MHRA 多头关系聚合:

与多头注意力相似,Uniformer将关系聚合器设计为多头风格,每个头单独处理一组channel的信息,每组的channel先通过线性变换生成上下文token V n ( X ) V_n(X) Vn(X),然后在token affinity A n A_n An的作用下,对上下文信息进行聚合。这里设计两种MHRA

  1. local MHRA:
    local MHRA用于浅层网络,在网络的浅层(前两阶段),token affinity应该仅关注局部邻域上下文,这与convolution的设计是一样的,因而将局部关系聚合 A n l o c a l A_n^{local} Anlocal设计为可学习的参数矩阵,且token affinity的值只与相对位置有关。
    在这里插入图片描述
    其中 X i X_i Xi为anchor token, X j X_j Xj为局部邻域中的任一token, a n a_n an为可学参数矩阵, ( i − j ) (i-j) (ij)为二者相对位置,表明token affinity的值只与相对位置有关。
    local UniFormer block与MobileNet block的风格相似,都是PWConv-DWConv-PWConv(见原论文解析),不同的是引入了额外的位置编码以及前馈层,这种特别的结合形式有效地增强了token的特征表达。
  2. global MHRA
    global MHRA用于深层网络,在网络的深层(后两阶段),对整个特征空间建立长时关系,这与self-attention的思想一致,因此通过比较全局上下文相似度建立token affinity
    在这里插入图片描述
    其中 Q n ( . ) , K n ( . ) Q_n(.),K_n(.) Qn(.),Kn(.)为不同的线性变换。

DPE 动态位置编码映射

使用卷积位置编码设计动态位置编码
在这里插入图片描述
DWConv为零填充的的深度可分离卷积。
一方面,卷积对任何输入形式都很友好,也很容易拓展到空间维度统一编码时空位置信息。另一方面,深度可分离卷积十分轻量,额外的零填充可以帮助每个token确定自己的绝对位置。

FFN 前馈神经网络

在这里插入图片描述
FFN无特别设计,组合了两个线性层和一个GELU激活函数。

总结:当前Video Transformer模型的主流改进方式

  1. 限制注意力关注区域,只关注部分时空位置【TimeSformer】
  2. 按照时空维度分解注意力计算过程【ViViT】;
  3. 引入卷积的归纳偏置,通过局部堆叠Encoder,将注意力集中在较小的邻域内【Swin TRM】;
  4. 以提取后的特征而非原始视频帧像素为输入,排除无用的信息,减少计算量【Uniformer】。

SPL模板写作分析

SPL全称IEEE Signal Processing Letters,篇幅较小,期刊要求4页正文,1页参文共五页**(双栏)**。
SPL全篇共有一下几部分

摘要

  • Abstract:按顺序为:简要介绍任务、动机、模型、设计模块、数据集,篇幅第一页左侧栏二分之一;

正文

  • Introduction:与其他会议不同,SPL的Introduction实际是Intro+Related Works,尤其注意篇幅长度,相关工作篇幅应占据单栏一栏左右,其段落划分与书写顺序为:任务介绍意义(一段)、相关工作介绍(两段)、动机发现与模型概括(一段)、总结贡献与模型表现(一段)。Intro结束,篇幅应到达第二页左栏二分之一处(包括图1);
  • Proposed Method(重点):详细介绍模型和设计的模块。总结Intro中的相关工作,再次强调动机,同时引出模型结构图(一段),而后使用3-4段详细阐述模块的设计。Method部分结束,篇幅应达到第三页左侧栏结束(1-2个图);
  • Experiments:简单介绍数据集(50-70词),介绍实验的设置,以及实验结果分析。这部分相对于会议论文的展示要少很多,可以做减法。在注意篇幅的情况下,尽可能给出表格与实验结果分析的图。Experiments结束,论文主要内容结束,注意预留200词左右的段落给结论部分即可;
  • Conclusions:与摘要对应,浓缩以上三个部分精华部分,但不能照抄。Conclusions结束,第四页结束,正文全部结束。

参考文献

注意格式和引文的遗漏。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
任务分配 第一部分 周荣 第二部分 杨林 第三部分 沈萧慧 第四部分 王东东 总结 魏华 把每个小类整理一下,放到相应的标题下面,注意格式 最后把自己做的复制到 调研报告对应的位置下面,就完成了。  一、 中国网络游戏用户基本情况     7.1.1 网络游戏用户性别、年龄、学历、职业特征     7.1.2 网络游戏用户收入水平与地域分布     7.1.3 网络游戏用户游戏年龄构成     7.1.4 网络游戏用户主要进行游戏的场所     7.1.5 网络游戏用户进行游戏的时间分布     7.1.6 不同性别网络游戏用户基本特征分析     7.1.7 不同主流用户群体基本特征分析      基于PC的电子游戏是中国网民中最流行的电子游戏,PC网络游戏、PC单机游 戏和手机游戏在中国是玩家最多的三种游戏类型。PC网络游戏玩家占到整体电子游戏玩 家比例的82.2%,而PC单机游戏和手机游戏玩家比例分别为56.8%和46.1%。手机游戏近期 发展迅猛,玩家比例已超过PC局域网对战游戏位列第三。 z 从网络游戏玩家的分布来看,66.6%的用户玩小型休闲网络游戏(例如QQ游戏平 台上的小型休闲网游),48.8%的用户玩MMORPG, 43.7%的用户玩高级休闲游戏; z 从年龄分布来看,中国网络游戏玩家的主力群体是18-24岁之间玩家,该年龄段 玩家占到了整体玩家的39.8%。高龄网络游戏玩家比例在升高,25-29岁和30- 35岁之间玩家分别达到了30.9%和17.8%。18岁以下玩家只占4.0%。防沉迷系统对低龄玩 家进入形成了有效的过滤作用; z 从性别分布来看,中国网络游戏玩家仍以男性为主:64.5%的网游玩家为男性,而 女性玩家则为35.4%。其中MMORPG男性玩家比例最高,达到了75.5%,而小型休闲网游的 男性玩家比例最低,但是也有58.6%; z 从收入分布来看,网游人群大部分为低收入人群,按照收入从低往高划分用户 群,相应群体的玩家比例不断下降,月收入在1500元以下和1501- 2500元之间的玩家比例分别为40.5%和19.5%; 二、中国网络游戏用户游戏行为分析    7.5.1 网页游戏用户获取信息渠道     7.5.2 网页游戏用户选择游戏的标准     7.5.3 网页游戏用户游戏类型偏好     7.5.4 网页游戏用户付费模式偏好     7.5.5 网页游戏用户离开上一个网页游戏的理由 玩家游戏行为: z "好友推荐"是玩家获知新游戏的最重要渠道之一,约58.3%的玩家好友引荐参 与游戏的。这说明网络游戏的增长已由用户自发增长带动,网游厂商在推广过程中除了 需要注意加强直接传播,也需要引导网友玩家推荐更多的朋友参与游戏; z 从玩家选择游戏的标准来看,67.3%的玩家表示他们选择游戏的主要标准之一是 "游戏画面"。游戏画面的质量能够直观体现开发商的技术实力,让玩家对游戏风格及游 戏内容有一个直观的了解。57.4%的玩家表示他们选择游戏的主要标准之一是"游戏的趣 味性,可玩性"。随着 网络游戏产业的发展,玩家对于网游产品的要求也在逐渐提高。简单的打怪升级玩法已 经不能满足玩家的娱乐需求,如何拓展游戏玩法,丰富游戏系统,将成为未来网络游戏 运营商工作的重点之一; z 从玩家的游戏地点来看,玩家继续向家庭转移:目前选择主要在家中玩网游的玩 家比例占57.3%,而预计未来一年主要在家中玩网游的玩家比例更是达到了69.5%; z 从玩家的在线时长来看,32.7%的玩家每周在线时长在1-5小时之间。这部分玩家 是轻度玩家,玩网络游戏纯为打发时间。15.6%的玩家每周在线时长在20小时以上,即每 天在线时间在3小时左右,他们是重度的网络游戏玩家,对网络游戏依赖性很强。 中国网络游戏市场用户调研报告2009 2.2玩家玩游戏地点 z 家是玩家玩游戏的最主要场所:目前选择主要在家中玩网游的玩家比例占 57.3%,而预计未来一年主要在家中玩网游的玩家比例更是达到了69.5%; z 选择主要在网吧玩游戏的玩家比例为8.0%,而预计未来一年主要在网吧中 玩游戏的玩家比例则下降到了6.3%。推测这是因为部分玩家已经预计在未来一年购买自 己的PC;选择在单位玩游戏的玩家比例约占9.8%,这一比例在未来一年也有所下降; z 学生玩家玩游戏场所集中于宿舍和学校机房,其中选择在宿舍玩游戏的玩家 占22.0%,未来一年内将下降至13.9%。这与毕业升学等因素密切相关; z 网游玩家玩游戏场所的变化直接导致网游营销的模式与渠道变化,传统的以 网吧为主要营销平台的模式需要转变为以线上线下结合为主的营销模式,大量的在线广 告与社区平台将成为网游营销的主要方式。    四、 中国网络游戏用户消费行为研究     7.4.1 网络游

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值