CNN / Transformer
文章平均质量分 93
CNN and Transformer
bryant_meng
究天人之际,通古今之变,成一家之言。
展开
-
【BoF】《Bag of Freebies for Training Object Detection Neural Networks》
arXiv-2019。原创 2024-09-19 00:27:36 · 808 阅读 · 0 评论 -
【DA】《Augmentation for small object detection》
arXiv-2019。原创 2024-08-19 17:10:00 · 706 阅读 · 0 评论 -
【ASFF】《Learning Spatial Fusion for Single-Shot Object Detection》
arXiv-2019。原创 2024-08-16 23:54:35 · 1038 阅读 · 0 评论 -
【Pre-training】Rethinking ImageNet Pre-training
ICCV-2019。原创 2024-08-13 14:03:35 · 830 阅读 · 0 评论 -
【SOT】《Transformers in single object tracking: an experimental survey》
由于目标是在跟踪序列的第一帧中给出的,因此在VOT中不可能获得大量样本,因此所有完全基于Transformer和基于CNN-Transformer的跟踪器都使用预先训练的网络,并将其视为骨干模型。基于CNN-Transformer的跟踪器成功地优于孪生网络,因为它们使用了可学习的Transformer而不是线性互相关运算。OTB 数据集上,纯 transformer 的效果没有 CNN 和 CNN-Transformer 的方法效果好。CNN-Transformer的跟踪器很难捕获全局特征表示。原创 2024-08-08 17:41:18 · 869 阅读 · 0 评论 -
【YOLOv7】《YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors》
CVPR-2023。原创 2024-08-01 20:57:12 · 774 阅读 · 0 评论 -
【FAS】《The Research of RGB Image Based Face Anti-Spoofing》
info GAN 里面涉及到了特征的解耦,作者解耦活检特征和内容特征(光照、ID、背景)人脸结构信息可能不是活检主要关注的信息,可以打乱,打乱还可以引入不同域的 patch 增加泛化性能。原创 2024-07-30 23:52:22 · 1002 阅读 · 0 评论 -
【SIoU】《SIoU Loss: More Powerful Learning for Bounding Box Regression》
arXiv-2022。原创 2024-07-17 23:14:08 · 913 阅读 · 0 评论 -
【YOLOX】《YOLOX:Exceeding YOLO Series in 2021》
arXiv-2021。原创 2024-07-16 21:07:16 · 751 阅读 · 0 评论 -
【YOLOv6】《YOLOv6:A Single-Stage Object Detection Framework for Industrial Applications》
arXiv-2022。原创 2024-07-16 10:18:40 · 1164 阅读 · 0 评论 -
【Pytorch】RNN for Image Classification
参数说明input_size输入特征的维度, 一般 rnn 中输入的是词向量,那么 input_size 就等于一个词向量的维度hidden_size隐藏层神经元个数,或者也叫输出的维度(因为rnn输出为各个时间步上的隐藏状态)num_layers网络的层数nonlinearity激活函数bias是否使用偏置。原创 2024-07-10 23:51:30 · 1057 阅读 · 1 评论 -
【MOT】《Multiple Object Tracking in Recent Times: A Literature Review》
原文参考文章。原创 2024-07-10 17:46:28 · 1032 阅读 · 0 评论 -
【AIGC】《AI-Generated Content (AIGC): A Survey》
原文:Wu J, Gan W, Chen Z, et al. Ai-generated content (aigc): A survey[J]. arXiv preprint arXiv:2304.06632, 2023.“1 The Road” 第一本由人工智能写的小说。原创 2024-06-26 11:34:29 · 1001 阅读 · 0 评论 -
【FAS】《Application of machine learning to face Anti-spoofing detection》
由于伪造欺骗人脸模仿真实人脸运动时,人脸会连带身后的背景区域一同运动,背景区域也会被识别。当一个点在运动时,对应图像上相同或位置的光源也在移动,这种基于图像亮度运动特征的提取方法便是光流法。真实人脸和伪造的欺骗二维人脸图像在运动模式上是不同的。李莉.反欺骗人脸活体图像的机器学习方法研究[D].广东工业学,2020.DOI:10.27029/d.cnki.ggdgu.2020.001204.训练中,网络模型一方面修复掩码或缺失的图像,一方面通过全局判别器进行真伪人脸图。三、基于融合特征的人脸活体检测方法。原创 2024-06-21 14:29:19 · 497 阅读 · 0 评论 -
【FAS】《Binocular camera based face liveness detection with optimized scene illumination recognition》
当测光点感知的光线较暗或者较亮的时候,调节摄像头的曝光程度和补光灯的状态,使得光线质量维持在稳定的范围内。为此,选择利用串级 PID 算法对摄像头的曝光和补光灯进行控制。串级 PID 算法对摄像头的感光度和补光灯进行控制,并利用人脸识别算法定位优化测光区域,从而对不同的光线强度和角度采取不同的策略。理论上讲,通过使用更大的光圈,或者更好素质的光学镜头,可以有效减少炫光的程度和发生概率。PID来调节不同光照条件下的曝光,颜水哥作者之一,CNN+曝光策略调节效果比CNN好很多。(e)配图感觉不太对。原创 2024-06-20 13:39:06 · 308 阅读 · 0 评论 -
【FAS】《Face Anti-Spoofing Algorithm Based on Combination of Multiple Facial Regions Using XXX》
多光谱图像拓宽了光谱范围,可获取物体更为丰富的反射特性,通过逐像元进行光谱归一化操作,可降低光照强度变化带来的影响,增强人脸反射特征区域的一致性。邓可望,赵娟,肖振中等.基于多光谱和面部多区域联合的人脸活体检测算法[J].集成技术,2024,13(01):72-81.的推广使得多光谱摄像头在消费电子领域中的应用成为可能。整体效果是有提升,其中硅胶材质改善最为明显。不同假体,不同区域反射率。原创 2024-06-20 10:00:36 · 329 阅读 · 0 评论 -
【FRS】《The Design and Implementation of Face Recognition System in Complex Environment》
将可见光照片的 ROI 区域从 BGR 颜色空间变换至 HSV 颜色空间,统计饱和度分量(Saturate)在 range(0,255),interval = 1 的概率分布。另一 个影响 CNN 在 处 理器 上执 行 效率 的概 念:内 存 访问 消 耗(MAC,memoryaccesscost),这里的内存还指代了处理器的缓存(cache)这里 sockets 指代处理器浮点运算指令发射通道数(例如 IntelHaswell 微架构的发射端口为 2 个port0 和 port1)原创 2024-06-19 15:11:59 · 870 阅读 · 0 评论 -
【FAS】《Survey on face anti-spoofing in face recognition》
光学体积描述术(photoplethysmography,PPG)是利用光学的方法测量血流体积,利用这项技术能获取诸如心率变化、血压、呼吸率、血氧饱和度、供血量、自主神经功能等信息,一般是接触式的。三维人脸和二维人脸的运动模式存在差异,3D 运动时脸部各处运动不一致产生不同的光流,2D产生的光流与其有差异。ps: 利用光流计算法计算相邻帧间的相同部分的光流域的差异和变化,从而来判断人脸的真实属性。用摄像头进行非接触式的心率测量,一般称之为 remote-PPG (r-PPG)2)基于心率检测分析。原创 2024-06-19 14:01:05 · 356 阅读 · 0 评论 -
【Multi-Facotr FAS】《Research and Design on Multi-Factor Enabled Facial Liveness Detection Systems》
本文提出的多因子活体检测系统,以人脸为基础,利用人机交互的方式,对人脸活性进行检测,其中人脸活体检测的方法较多,从最简单的张嘴,眨眼,摇头,甚至基于以上动作扩展的方法到现在的基于眼睛视线的实时检测,人脸表情的分析以及最新的基于人脸距离摄像机距离产生不同的关键点的变化来抵御目前威胁最大的照片、视频和 3D 虚拟人脸攻击。但因为鲁棒性和用户体验度问题将信任度设置较低,将以上方法按顺序进行排序,则 n 的取值为 28,最后生成的 number 则对应的为检测方法,系统调用该检测方法的测试模型。原创 2024-06-17 20:29:54 · 599 阅读 · 0 评论 -
【Bootstrap Faster R-CNN】《Is Faster R-CNN Doing Well for Pedestrian Detection?》
ECCV-2016中山大学。原创 2024-06-14 17:32:58 · 1227 阅读 · 0 评论 -
【Da-SiamRPN】《Distractor-aware Siamese Networks for Visual Object Tracking》
ECCV-2018中科大。原创 2024-06-14 14:00:30 · 1308 阅读 · 0 评论 -
【FAS】《Research on Face Liveness Detection Algorithm Based on Multi-mode Fusion 》
1)文中对 HSV 和 YCbCr 颜色空间上的完整人脸与局部 patch 图像以及包含动态信息的时序图像进行特征提取,并为此设计了一种多输入的融合网络。数据库中每一帧的相似性较高,所以堆叠过后的时序图没有包含丰富的动态特征,时序特征要比在 RGB 颜色空间上中获得的特征更具有鉴别力。由于攻击类型的多样性、环境的干扰以及不同种类摄像头采集图像的差异等因素的影响,使得活体检测模型在现实场景使用中效果不佳。这里的决策网络融合了不同 level 的 feature。光照强度的影响、背景的干扰、摄像头的视点等。原创 2024-06-07 20:44:52 · 448 阅读 · 0 评论 -
【FAS】《Review on face liveness detection》
2 人脸活体检测的传感设备除了最常用的RGB摄像头,双目相机、(近)红外相机、深度相机、3维扫描仪、光场相机和多光谱成像仪,此外闪光灯也被用于辅助ps: 光场虚假人脸与真实人脸的一个重要区别在于表面反射特性。热红外、近红外和多光谱成像均可实现提取诸类信息——由于人工材料的多样性,基于近红外传感的方式有时候难以捕捉真实人脸和人工材料面具之间的反射率差异热辐射可以区分人造材料与真实皮肤,但是热辐射也会穿透人工材料闪光。原创 2024-06-06 23:54:39 · 261 阅读 · 0 评论 -
【FAS】《Liveness Detection on Face Anti-spoofing》
时序运动信息与传统的空间纹理信息相结合基于相位平移的运动放大算法不错视觉大小细胞通路距离度量双分支三维卷积模型动态运动线索分支来模拟人眼视觉系统的大细胞通路,静态纹理信息分支模拟人眼的小细胞通路基于相位平移的运动放大算法来提高人脸活体检测模型提取运动特征的效率和能力。原创 2024-06-06 23:48:36 · 316 阅读 · 1 评论 -
【Multi-Feature FAS】《Face Anti-Spoofing Based on Multi-Feature Fusion》
光流:rPPG:首次引入远程心率信号(remote Photo Plethysmography, rPPG)来解决的人脸防伪算法是有着较大的创新检测也帮忙卡活检,配合手动设计的特征。原创 2024-06-05 20:51:06 · 673 阅读 · 0 评论 -
【Multimodality FAS】《Research on The Key Techniques of Multi-mode Face Anti-spoofing》
人脸姿态动作敏感,识别率低,用户体验差提高识别准确率,摆脱用户配合的步骤,提升用户体验贡献:1)通过目前公开数据集的 RGB 图像来生成不同的模态,例如宽动态范围图像(High-Dynamic Range,HDR),深度图等,进而分析研究生成的不同模态对活体检测任务的影响2)构建数据集3)提出一种多模态活体检测网络模型并实现了多模态活体检测系统基于生成多模态的 RGB 图像人脸活体检测算法 (HDR 和 深度是生成的)基于多模态的人脸活体检测算法(HDR and NIR)原创 2024-06-05 20:41:55 · 611 阅读 · 0 评论 -
【LightTrack】《LightTrack:Finding Lightweight Neural Networks for Object Tracking via xxx》
CVPR-2021。原创 2024-05-27 21:07:36 · 964 阅读 · 0 评论 -
【SiamRPN】《High Performance Visual Tracking With Siamese Region Proposal Network》
CVPR-2018商汤科技。原创 2024-05-20 10:31:33 · 886 阅读 · 0 评论 -
【Snapshot Ensembles】《Snapshot Ensembles:Train 1,Get M for Free》
ICLR-2017。原创 2024-04-17 20:14:44 · 966 阅读 · 0 评论 -
【CLR】《Cyclical Learning Rates for Training Neural Networks》
WACV-2017。原创 2024-04-15 17:08:42 · 861 阅读 · 0 评论 -
【SGDR】《SGDR:Stochastic Gradient Descent with Warm Restarts》
ICLR-2017。原创 2024-04-12 16:04:07 · 1445 阅读 · 0 评论 -
【GN】《Group Normalization》
ECCV-2018更多论文解读,可参考。原创 2024-04-10 20:09:41 · 632 阅读 · 0 评论 -
【Transformer】Introduction to Transformer
学习笔记。原创 2024-04-03 10:31:00 · 297 阅读 · 0 评论 -
【DeepLab-v1】《Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs》
ICLR-2015声名显赫的家族,是时候顶礼膜拜一波了!文章目录1 Background and Motivation2 Advantages / Contributions3 Method4 Experiments4.1 Datasets5 Conclusion(own) / Future work1 Background and Motivation近年来,深度卷积神经网络(Deep C)在计算机视觉系统的性能提高到了一个新的高度We show that responses at th.原创 2024-03-25 19:26:52 · 1000 阅读 · 0 评论 -
【EDSR】《Enhanced Deep Residual Networks for Single Image Super-Resolution》
提升宽度可以显著提升 model capacity,但是 inception-v4 中观察到 if filters number(width) 超过 1000,网络迭代后会慢慢死掉(average pooling 之前的 layer的输出为0),作者加大宽度的时候也会遇到这个问题,解决办法, Scaling of the Residuals——训练的时候,对应任务部分才训练,其余部分都冻住,例如训练 x2 SR 的时候,x3 和 x4 相关 resblock 被冻结。原创 2024-03-19 20:53:13 · 1106 阅读 · 0 评论 -
【EfficientNetV2】《EfficientNetV2: Smaller Models and Faster Training》
googleICML-2021efficientNet v1(【EfficientNet】《EfficientNet:Rethinking Model Scaling for Convolutional Neural Networks》) 的基础上升级, faster training speed and better parameter efficiency作者观察到提出 EfficentNet v2,用 training-aware neural architecture search and scal原创 2024-03-14 10:10:24 · 935 阅读 · 0 评论 -
【SiamFC】《Fully-Convolutional Siamese Networks for Object Tracking》
作者基于全卷积孪生网络,来实现单目标跟踪,且只要是目标检测的数据集,都可以拿来训练(the fairness of training and testing deep models for tracking using videos from the same domain is a point of controversy)v 是 score map 上的得分(0-1)之间。缺点:框的 spatial ratio 是固定的。每个空间位置的 b 应该是相等的吧。训练的时候用的 SGD 优化。原创 2024-02-22 17:36:25 · 963 阅读 · 0 评论 -
【Light Reflection】《Aurora Guard:Real-Time Face Anti-Spoofing via Light Reflection》
arXiv-2020。原创 2024-02-07 10:36:34 · 903 阅读 · 0 评论 -
【PSA】《Polarized Self-Attention: Towards High-quality Pixel-wise Regression》
arXiv-2020。原创 2024-02-05 09:44:33 · 1298 阅读 · 0 评论 -
【FAS Survey】《Deep learning for face anti-spoofing: A Survey》
PAMI-2022最新成果:https://github.com/ZitongYu/DeepFAS。原创 2024-01-31 10:51:52 · 1157 阅读 · 0 评论