文章题目:CCST: crowd counting with swin transformer
文章链接:https://link.springer.com/article/10.1007/s00371-022-02485-3#Sec11
摘要:准确估计图像中包含的个体数量是人群计数的目的。它一直面临着两大难题:人群密度分布不均和人头跨度大。针对前者,大多数基于cnn的方法将图像分成多个小块进行处理,忽略了小块之间的联系。对于后者,使用特征金字塔的多尺度特征融合方法忽略了头部大小与层次特征之间的匹配关系。针对上述问题,我们提出了一种基于swin变压器的人群计数网络CCST,并定制了一种特征自适应融合回归头FAFHead。Swin变压器可以在斑块内部和斑块之间充分交换信息,有效缓解人群密度分布不均匀的问题。FAFHead能够自适应融合多层次特征,改善了头尺寸与特征金字塔层次的匹配关系,解决了头尺寸可用跨度大的问题。在常用数据集上的实验结果表明,CCST的计数性能优于所有弱监督计数算法和绝大多数流行的基于密度图的全监督计数算法。
解决的问题:人头尺度不一和人群密度分布不均匀
模型框架:非常质朴简单,Swin Transformer + FPN结构 + FAFhead 回归头
模型性能:挺好的
总结:有点水,但是还行。