自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

原创 Spatial Uncertainty-Aware Semi-Supervised Crowd Counting

提出的空间不确定性感知师生框架关注高置信度区域的信息,同时以端到端的方式处理来自未标注数据的噪声监督。提出一种基于正则化代理任务(二值分割)的空间不确定性感知半监督方法。考虑空间不确定性的半监督人群计数。

2022-10-30 14:59:16 205 1

原创 注意力机制

处理信息时会过滤掉不太关注的信息、着重于感兴趣信息的机制称为。在计算机视觉领域,按照注意力关注的域,可以将其分成。自下而上无意识、由外界刺激引发的注意力称为。自上而下有意识地聚焦称为。

2022-10-28 17:51:33 597

原创 Exploiting sample correlation for crowd counting with multi-expert network

为了获得由相似的样本组成的聚类,基于协同微调相似性设计了一种简单的聚类方法来在密集的人群数据集中发现潜在的聚类,然后每个聚类用于获得专家的参数。),可以反应最优专家参数之间的相关性(可以近似地描述在包含这两个样本的子集上进行微调之后模型的性能改进)。为了获得有效的专家,大多数专家计数方法采用了差分训练技术(只是减少了对当前样本最准确预测的专家的损失)每个专家都是通过在训练数据的子集上微调模型而产生的。为了减少参数的储存空间和避免对聚类的过度拟合,设计了一个简单而有效的人群计数模型(探索了如何有效的使用。

2022-10-26 21:50:53 393

原创 Transformer模型中各个结构的理解

即将解码器的输入与编码器中编码好的每个单词的representation计算Attention score,然后计算Attention score与V的矩阵乘法,从而得到编码器中编码单词在解码器中待翻译单词中的表达。(而不像编码器中可以以并行的形式对句子中的所有单词进行Attention计算),即同Seq2Seq模型中解码器部分一样需要一个单词一个单词的进行输入,即我们只有在某一时刻预测出了某一单词后,才能继续预测后面的词。不妨假设我们的模型从训练集中学习一万个不同的英语单词(我们模型的“输出词表”)。

2022-09-17 20:08:43 605

原创 Transformer中,MHSA(multi-head self-attention)中为什么要分多个Head?

Transformer中,MHSA(multi-head self-attention)中为什么要分多个Head?

2022-09-17 19:57:50 2007

原创 MSE与MAE

MSE与MAE的区别与选择

2022-09-17 15:09:30 9516

原创 Focal Self-attention for Local-Global Interactions inVision Transformers

本文提出了 focal self-attention,这是一种结合了细粒度局部交互和粗粒度全局交互的新机制。在这个新的机制中,每个 token 以细粒度关注其最近的周围 token,以粗粒度关注其远的周围 token,从而可以有效地捕获短期和长期的可视依赖关系。基于焦点自注意,提出了 focal Transformer,在一系列公共图像分类和目标检测基准上实现了优于先进的 (SoTA) ViT 的性能。

2022-09-17 14:40:32 691

原创 Shunted Self Attention via Multi Scale Token Aggregatio | CVPR 2022

Propose a novel and generic strategy, termed shunted self-attention (SSA), that allows ViTs to model the attentions athybrid scales per attention layer .

2022-09-16 15:34:10 86

原创 Counting Varying Density Crowds Through Density Guided Adaptive Selection CNN and Transformer Estim

提出了一种CNN和Transformer自适应选择网络(CTASNet),该网络可以针对不同密度区域自适应选择适当的计数支路。首先,CTASNet生成CNN和Transformer的预测结果。然后,考虑到CNN/Transformer适用于低密度/高密度区域,设计了密度引导的自适应选择模块,以自动组合CNN和Transformer的预测,此外,为了减少注释噪声的影响,我们引入了基于相关熵的最优传输损耗。CNN和Transformer自适应选择网络(CTASNet),该框架能够在低密度区域自适应定位目标,并在

2022-09-16 11:16:56 314 1

原创 Boosting Crowd Counting via Multifaceted Attention

提出了一种多方面注意网络(MAN)来改进局部空间关系编码中的transformer模型。MAN将来自vanilla transformer的全局注意力、可学习的局部注意力和实例注意力合并到一个计算模型中。

2022-09-16 11:14:30 888

原创 CrowdFormer

提出了一种使用金字塔vision transformer的弱监督人群计数方法。利用金字塔vision transformer提取具有全局上下文的多尺度特征,提出了一个有效的特征聚合模块,将来自transformer不同阶段的特征和一个简单的回归头结合起来,以估计人群数量。

2022-09-16 11:11:17 189

原创 Boosting Crowd Counting with Transformers

研究了全局上下文在人群计数中的作用。提出了两个新的模块:token注意模块(TAM)和回归token模块(RTM)。引入token注意模块(TAM)来细化由上下文token通知的编码特征。使用回归token模块(RTM)进一步指导上下文token的学习,该模块在人群总数的回归中容纳辅助损失提出的TAM模块旨在解决vision transformer中的多头自注意力(MHSA)仅模拟空间交互的观察问题,而经过验证的真实通道交互也被证明具有至关重要的有效性。为此,TAM通过特征通道的条件重新校准将上

2022-09-16 11:09:34 240

原创 Congested Crowd Instance Localization with Dilated Convolutional Swin Transformer

提出了一种将transformer和传统卷积网络方法相结合的方法来解决人群定位的密集预测问题。在Swin Transformer主干中,在不同阶段插入两个扩展卷积块以扩大感受野,这有效地提高了特征提取的能力,尤其是对于人群场景中的微小对象、相互遮挡和模糊区域。

2022-09-16 11:07:57 562

原创 An End-to-End Transformer Model for Crowd Localization

将人群定位视为一个直接集预测问题,将提取的特征和可训练的嵌入作为transformer解码器的输入。为了获得良好的匹配结果,引入了一种基于KMO的匈牙利算法,它创新性地从上下文视图而不是独立的实例视图重新访问标签分配。

2022-09-16 11:06:04 1268 6

原创 Joint CNN and Transformer Network via weaklysupervised Learning for efficient crowd counting

提出了一种用于有效弱监督人群计数的联合CNN和Transformer学习网络,称为JCTNet。该模型包括三个部分:CNN特征提取模块(CFM)用于提取群组语义信息,Transformer提取模块(TFM)用于捕获全局上下文并彻底学习前景和背景之间的对比特征,计数回归模块(CRM)用于估计最终人数。大量实验和可视化结果表明,该JCTNet在五个主流数据集上都是有效的。

2022-09-16 11:04:20 240

原创 CCTrans: Simplifying and Improving Crowd Counting with Transformer

提出了一种在弱监督和完全监督设置下进行人群计数的简单传输路径。该传输路径包含四个组件:一个金字塔Vision Transformer,用于更好地捕捉全局上下文;一个金字塔特征聚合(PFA)模块,结合低层和高层特征,充分利用从粗到细的信息;多尺度扩展卷积(MDC)的高效回归头来用于提供多尺度感受野,预测密度图;尾损失函数,用于稳定训练过程。

2022-09-16 11:01:44 908

原创 TransCrowd: Weakly-Supervised Crowd Counting with Transformer

从序列到计数的角度重新表述了计数问题,并提出了一种弱监督计数方法,该方法仅利用计数级注释,在训练阶段不使用点级信息。与弱监督方法相比,该方法实现了最先进的计数性能。此外,与全监督计数方法相比,我们的方法具有高度竞争性的计数性能。当前弱监督计数方法采用CNN,而CNN感受野有限。未来,我们计划使用Transformer架构实现。全监督计数,并将其扩展到基于视频的计数任务。可以产生更合理的注意力权重,并。提供了两种不同类型命名为。更快的收敛和更高的计数性能。ransformer的。

2022-09-16 10:58:27 564

原创 Faster RCNN 学习笔记

下面的介绍都是基于VGG16的Faster RCNN网络,各网络的差异在于Conv layers层提取特征时有细微差异,至于后续的RPN层、Pooling层及全连接的分类和目标定位基本相同.一)、整体框架我们先整体的介绍下上图中各层主要的功能1)、Conv layers提取特征图:作为一种CNN网络目标检测方法,Faster RCNN首先使用一组基础的conv+relu+pooling层提取input image的feature maps,该feature maps会用于后续的R..

2021-10-15 17:21:09 60

原创 Linux——vi命令详解

vi编辑器是所有Unix及Linux系统下标准的编辑器,它的强大不逊色于任何最新的文本编辑器,这里只是简单地介绍一下它的用法和一小部分指令。由于对Unix及Linux系统的任何版本,vi编辑器是完全相同的,因此您可以在其他任何介绍vi的地方进一步了解它。Vi也是Linux中最基本的文本编辑器,学会它后,您将在Linux的世界里畅行无阻。

2021-07-15 18:57:33 5655

原创 Git 中 warning: LF will be replaced by CRLF in readme.txt.问题解决

执行git add 和 git diff命令时会提示以下内容意思是:警告:LF将被readme.txt中的CRLF替换。该文件将在工作目录中以其原始行结尾。出现此问题是因为不同操作系统的使用的换行符不同:Linux / Unix 采用换行符LF表示下一行Windows 采用回车+换行 CRLF表示下一行解决:可以通过设置 core.autocrlf 的值解决$ git config --global core.autocrlf false # 关闭自动转换...

2021-07-15 18:47:59 441

原创 $ python hello.py运行失败

交互式编程:直接在命令行写代码脚本式编程:把代码写在一个.py后缀名的文件里面然后在命令行调用文件名 $ python hello.py错误原因$ python hello.py$是unix或者linux里面的专用符号,$的意思就是“提示用户输入命令行”正确的做法先通过dos命令进入hello.py的文件位置,然后输入python hello.py...

2021-07-14 17:46:15 320

原创 不容易系列之二

Description你活的不容易,我活的不容易,他活的也不容易。不过,如果你看了下面的故事,就会知道,有位老汉比你还不容易。重庆市郊黄泥板村的徐老汉(大号徐东海,简称XDH)这两年辛辛苦苦养了不少羊,到了今年夏天,由于众所周知的高温干旱,实在没办法解决牲畜的饮水问题,就决定把这些羊都赶到集市去卖。从黄泥板村到交易地点要经过N个收费站,按说这收费站和徐老汉没什么关系,但是事实却令徐老汉欲哭无...

2018-07-19 10:16:32 38

原创 素数筛选法

Description编写函数1,判断一个数是否是素数,主函数中,找出m~n之间的所有素数Input整数m nOutput所有素数Sample Input7 20Sample Output7 11 13 17 19 #include<math.h>int main(){ ...

2018-07-19 10:05:11 39

原创 西游记蟠桃记

喜欢西游记的同学肯定都知道悟空偷吃蟠桃的故事,你们一定都觉得这猴子太闹腾了,其实你们是有所不知:悟空是在研究一个数学问题!

2018-07-19 10:04:04 50

原创 算法:骨牌铺方格

在2×n的一个长方形方格中,用一个1× 2的骨牌铺满方格,输入n ,输出铺放方案的总数. 例如n=3时,为2× 3方格,骨牌的铺放方案有三种,如下图: Input输入数据由多行组成,每行包含一个整数n,表示该测试实例的长方形方格的规格是2×n (0< n<=50)。Output对于每个测试实例,请输出铺放方案的总数,每个实例的输出占一行。...

2018-07-19 10:02:08 267

原创 下沙的沙子有几粒?

Description2005年11月份,我们学校参加了ACM/ICPC 亚洲赛区成都站的比赛,在这里,我们获得了历史性的突破,尽管只是一枚铜牌,但获奖那一刻的激动,也许将永远铭刻在我们几个人的心头。借此机会,特向去年为参加ACM亚洲赛而艰苦集训了近半年的各位老队员表示感谢。实际上,除了获奖以外,在这次比赛期间还有一件事也让我们记忆深刻。那是比赛当天等待入场的时候,听到某个学校的一个队员在说...

2018-07-19 09:58:08 36

原创 母猪的故事(斐波那契)

Description话说现在猪肉价格这么贵,著名的ACBoy 0068 也开始了养猪生活。说来也奇怪,他养的猪一出生第二天开始就能每天中午生一只小猪,而且生下来的竟然都是母猪。不过光生小猪也不行,0068采用了一个很奇特的办法来管理他的养猪场:对于每头刚出生的小猪,在他生下第二头小猪后立马被杀掉,卖到超市里。假设在创业的第一天,0068只买了一头刚出生的小猪,请问,在第N天晚上,006...

2018-07-19 09:55:48 67

原创 神、上帝以及老天爷(错排)

Description协会活动为了活跃气氛,组织者举行了一个别开生面、奖品丰厚的抽奖活动,这个活动的具体要求是这样的: 首先,所有参加晚会的人员都将一张写有自己名字的字条放入抽奖箱中; 然后,待所有字条加入完毕,每人从箱中取一个字条; 最后,如果取得的字条上写的就是自己的名字,那么“恭喜你,中奖了!” 大家可以想象一下当时的气氛之热烈,毕竟中奖者的奖品是大家梦寐以求的Twins签名照呀!不过,...

2018-07-19 09:53:56 67

原创 Fibbonacci Number斐波那契数列

DescriptionYour objective for this question is to develop a program which will generate a fibbonacci number. The fibbonacci function is defined as such:f(0) = 0f(1) = 1f(n) = f(n-1) + f(n-2)Your...

2018-07-19 09:51:26 64

原创 解题报告_sum of consecutive prime numbers

Sum of Consecutive Prime NumbersTime Limit: 1000MS Memory Limit: 65536KTotal Submissions: 26954 Accepted: 14544Description Some positive integers can be represented by a sum of oneor more cons...

2018-07-19 09:47:32 33

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除