论文阅读
文章平均质量分 73
主要介绍论文的思路与思想,并且包含相应的实现代码,欢迎留言交流
weixin_44576543
QQ 1154957554 欢迎交流探讨
展开
-
yovo3和yovo3-tiny结构图
yolov3yolov3-tinylink:https://www.cnblogs.com/Ph-one/p/13994182.htmlhttps://www.cnblogs.com/wy-blogs/p/10509381.html原创 2021-07-26 15:40:48 · 196 阅读 · 0 评论 -
AugFPN: Improving Multi-scale Feature Learning for Object Detection 论文阅读
AugFPN: Improving Multi-scale Feature Learning for Object Detection多尺度特征学习用于目标检测摘要:目前的目标检测多使用金字塔获取不同尺度特征,然而FPN方式通过多尺度的融合,这种机制的设计阻碍了多尺度特征完全的融合。在本文中 分析这种设计的缺点,引入新的框架 增强FPN,特别地这种aug-FPN解决这种问题。包括连续地监督、残差特征增加。Soft Roi选择 。通过连续的监督缩小不同尺度语义信息的差异于不同尺度特征。在特征融..原创 2021-04-07 13:36:24 · 424 阅读 · 0 评论 -
Pyramid Feature Attention Network for Saliency detection 论文阅读
Pyramid Feature Attention Network for Saliency detection用于显著性检测的金字塔特征注意力网络摘要:显著性目标检测为计算机视觉一大挑战,然后如何提取高效特征?最近的一些方法采用不加区别的集成多尺度卷积特征,然而并非所有特征都对显著性检测有效,一些特征也会引起干扰。为了解决上述问题 提出显著性金字塔网络模型聚焦于高效的高级语义和低级空间结构特征。首先设计用于提取高层特征获取丰富的上下文信息的CPFE,然后采用通道注意力模块在CPFE后使用,使用空间原创 2021-04-06 23:22:53 · 327 阅读 · 0 评论 -
Receptive Field Block Net 论文阅读
Receptive Field Block Net for Accurate and Fast Object Detection 用于快速精确的目标检测的接受野模块Code link: https://github.com/ruinmessi/RFBNet摘要:目前表现最好的目标检测依赖于深度主干网络的,比如说ResNet-101 和inception,得益于强大的特征表征能力但具有较高的计算消耗,相反一些轻量级的模型检测器能够实时监测,然后准确率方面存在不足,本文我们研究建立高效和准确的检测器通.原创 2021-04-03 23:27:28 · 257 阅读 · 0 评论 -
CBAM: Convolutional Block Attention Module 论文阅读
CBAM: Convolutional Block Attention Module摘要:提出了卷积注意力模块 简答高效的前向卷积神经网络,feature-map推理的特征图有两个维度,分别是空间和通道注意力机制,因为注意力模块是轻量化的不增加网络负担,可以整合到CNN的任意位置,实验说明整个模块的有效性和实用性。引文基于丰富的特征表达能力CNN推动了多项视觉任务的发展,为了增强CNN的表现,深度、宽度、基数三个重要的因素。自从LeNet网络以来到现在残差式的网络,为了更好特征表达,网络的.原创 2021-03-30 22:06:03 · 455 阅读 · 0 评论 -
Developing an Image Manipulation Detection Algorithm Based on Edge Detection and Faster R-CNN论文阅读
Developing an Image Manipulation DetectionAlgorithm Based on Edge Detection andFaster R-CNN摘要:提出基于faster-rcnn和边缘检测的取证网络,resnet101作为backbone提取篡改特征,这些特征输入roi池化层,文中使用双线性插值代替池化层,同时边缘特征输入到roi插值层进行特征融合,采用FCN来进行篡改分类,实验结果表明不同的图像数据集使用定位篡改图像,展现出提出方法更具效率。...原创 2021-03-30 11:00:10 · 222 阅读 · 0 评论 -
Detection and localization of image forgeries using improved mask regional cnn论文阅读
Detection and localization of image forgeries using improved mask regional convolutional neural network用于篡改取证的mask 区域卷积神经网络摘要:传统方法使用手工特征或基于浅层的特征,因此导致限制的表达能力和较重的计算负载,最近 深度学习表现出强大的复杂的统计特征包括高纬度输出和学习层次表达,为了提取更多篡改图像和真实图像之间的区别性特征,提出改进的mask-rcnn,采用sober算子作为辅助原创 2021-03-29 22:55:42 · 238 阅读 · 0 评论 -
ManTra-Net: Manipulation Tracing Network论文阅读记录
摘要:提出Mantra-Net端到端的深度学习框架用于现实生活中的篡改取证,并不包含前后处理操作具有检测和定位 的功能,包括拼接、复制粘贴、移除、增强等未知类型。提出一种可以检测385中类型的篡改痕迹检测简单高效的自监督模型,把图像篡改当做异常检测,实验证明其应对多种篡改操作的组合。5、实验部分以上部分已经说明了篡改痕迹特征和异常检测网络,在标注数据集中评估其泛化性能、敏感性、鲁棒性能等,使用AUC作为性能评估标准,由于网络中少部分原始像素错误认为篡改像素,在网络中并未得到惩罚(一定程度上会造.原创 2021-01-15 10:19:01 · 409 阅读 · 0 评论 -
Exploiting Spatial Structure for Localizing Manipulated Image Regions论文阅读记录
摘要:深度学习在目标检测方法取得巨大的成功,与语义分割不同,篡改取证更注重篡改取的定位,为了定位篡改区域使用cnn-LSTM框架建模,利用篡改区域边界差异形成篡改区域定位框架4实验部分确定图像块是否篡改并分割篡改区域两个任务,在此三个数据集上实验three datasets- NIST [3],IEEE Forensics Challenge [2], COVERAGE [57].图像块的分类和语义分割是同时进行的,NIST包含三种篡改类型 复制粘贴、删除、拼接。COVERAGE同样..原创 2021-01-12 20:26:58 · 418 阅读 · 0 评论 -
Learning Rich Features for Image Manipulation Detection 论文阅读记录
4、实验部分在四个数据集上比较结果,同时比较数据增广和不同压缩方面的鲁棒性标准数据集合并未足够的数据,使用COCO数据集进行预训练,训练和测试比例0.9 0.1确保训练集与测试集不同时出现,创建42K篡改图片和真实图片,同时bounding box也标准释放篡改,适当增加了box的大小。在合成数据上,resnet101在FASTER -RCNN网络上,使用评价精确度(AP)来评估,表1上显示 双流网络的单数据流, 比较两个特征的影响度和结合后的结果下面列举了4个数据集和...原创 2021-01-12 16:29:16 · 235 阅读 · 1 评论 -
U2-Net: Going Deeper with Nested U-Structure for Salient Object Detection论文阅读记录
摘要:提出显著性检测的新框架 优势:(1由于利用残差U行快,获取不同尺度的混合上下文信息(2增加框架深度的同时并未显著的增加网络的计算资源。框架不依赖其他backbone 网络,从头开始训练GitHub :https://github.com/NathanUA/U-2-Net.1、介绍显著性检测目的分割出视觉上更吸引的物体,由于cnn的发展,显著性目标检测领域发展迅速,存在一些挑战需要解决指出常见SOD使用backbonesuch as Alexnet [17], VGG [35], R..原创 2021-01-12 15:22:42 · 456 阅读 · 0 评论 -
图像篡改数据集CASIA 1.0分享 001
参考链接:https://www.cnblogs.com/qina/p/12696284.htmlhttps://www.zhihu.com/question/45555137/answer/441194586原创 2020-09-25 13:23:04 · 5011 阅读 · 5 评论 -
Image splicing localization using PCA-based noise level estimation论文阅读
原创 2020-04-11 20:11:56 · 214 阅读 · 0 评论 -
Geometric tampering estimation by means of a sift-based forensic analysis论文阅读
提出了基于sift的图像复制的检测方法,并估计图片的几何转换参数文章架构:1.引言 2.sift的介绍3.提出方法的细节4.实验结论与参数估计5.结论二、第二章 旋转 缩放 Fmt(fourier mellin transform) 针对10度以上 ...原创 2020-04-03 14:42:04 · 192 阅读 · 0 评论 -
Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering 论文阅读
Convolutional Neural Networks on Graphs with Fast Localized Spectral FilteringCode link:https://github.com/mdeff/cnn_graph目录目录1引言... 12 提出的方法... 12.1 学习快速定位谱过滤器... 22.2图的粗化... 33相关工...原创 2019-12-18 16:37:03 · 3327 阅读 · 3 评论 -
Spectral Networks and Deep Locally Connected Networks on Graphs 论文阅读
Spectral Networks and Deep Locally Connected Networks on GraphsCode link:摘要:CNN在图片识别与语音等任务上取得很大的成功,由于其具有局部转变不变性,在本文中,探索一种可能的CNN应用于更多的领域,特别的,我们提出一种基于层次聚类的框架,另外是基于图拉普拉斯谱图的,展示了低维图上使用少量参数来运用卷积层,表现很好的性...原创 2019-12-17 10:42:43 · 1826 阅读 · 1 评论 -
Hybrid LSTM and Encoder–Decoder Architecture for Detection of Image Forgeries论文阅读
Hybrid LSTM and Encoder–Decoder Architecture for Detection of Image ForgeriesCode link:https://github.com/jawadbappy/forgery_localization_HLED1 摘要随着图像修改工具的进步,图像内容的修改日益严重,包含复制克隆、物体拼接、移动等操作的检测变得很具...原创 2019-12-09 15:32:15 · 2694 阅读 · 8 评论 -
HOW POWERFUL ARE GRAPH NEURAL NETWORKS? 论文阅读
HOW POWERFUL ARE GRAPH NEURAL NETWORKS?Code link: https://github.com/weihua916/powerful-gnns摘要:GNN对于图形的特征很有效,其可以通过不断汇聚领节点的信息,GNN的变体在节点还是图形分类方面都取得很多的成就,然后即便GNN革命性的特征表达,然后还是存在属性的理解限制,因此提出了能够从不同的GNN...原创 2019-11-28 15:57:25 · 1244 阅读 · 1 评论 -
FEW-SHOT LEARNING WITH GRAPH NEURAL NETWORK
FEW-SHOT LEARNING WITH GRAPH NEURAL NETWORK使用图神经网络的小样本学习代码:github.com/vgsatorras/few-shot-gnn摘要:我们提出研究一种基于部分观察图形模型的三棱镜推理的小样本学习问题,建立一组图片(标记或者不标记),通过同化消息传递推理算法使用深度学习框架,定义了可以泛化的小样本学习图神经网络框架,我们的框架很...原创 2019-11-16 13:44:32 · 630 阅读 · 0 评论 -
Rethinking Knowledge Graph Propagation for Zero-Shot Learning
Rethinking Knowledge Graph Propagation for Zero-Shot Learning(零样本的知识图谱传播再思考)代码: https://github.com/cyvius96/adgpm.摘要:图卷积神经网络对于零样本学习上有很大的潜力,模型能够很强的泛化能力生成新类,当缺少样本的时候,然而,多层架构需要在图中传播,传播的过程中使用拉普拉斯光滑会相...原创 2019-11-15 16:42:38 · 679 阅读 · 0 评论 -
二Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network
二、Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network摘要:先前的跨语言的知识图谱对齐研究依赖于实体嵌入的思想,,其不能够在两个知识图谱上;此文介绍一种方法,表示其上下文信息的特征实体,主体实体图(局部实体子图),从这个角度来看,知识库的对齐工作可以看做图匹配问题,进一步提出 注意力机制的解决方案...原创 2019-11-12 16:48:02 · 2341 阅读 · 4 评论 -
一、 Knowledge Transfer for Out-of-Knowledge-Base Entities: A Graph Neural Network Approach
Knowledge Transfer for Out-of-Knowledge-Base Entities: A Graph Neural Network Approach摘要:知识库补全目的是预测知识库中缺少的信息,在本文中,作者提出用于解决知识库之外的实体问题:如何回答在训练时未观测到的信息;现存的基于嵌入的知识库补全不能解决知识库之外的信息,解决这个问题的方法是再训练,但是此方法缺少灵...原创 2019-11-12 13:14:44 · 1255 阅读 · 0 评论 -
An Attentive Survey of Attention Models 论文阅读
摘要:注意力模型应用于各个领域,这个研究提供了系统与完整的注意力模型的发展概述,我们提出来现有注意力模型的分类方法,展示了注意力模型在各个领域相结合的方法,提高了注意力模型的可解释性,最终讨论了一些注意力模型的实际应用;介绍AM模型最早被用于机器翻译领域,并占有一定的影响力,在AI 方面对于神经网络框架存在大量的应用,自然语言处理、统计学习、语音与计算机视觉方面;AM的背后的原理是可以被解释...原创 2019-10-28 16:26:08 · 728 阅读 · 0 评论 -
二、AFD-Net: Aggregated Feature Difference Learning for Cross-Spectral Image Patch Matching论文阅读
摘要:跨光谱成像的图片的图像块匹配的难度远大于单光谱成像的图像块匹配,原因存在两点,第一通过传统的CNN的方法提取的特征差别很微弱,同时不同的成像原理带来很大的表征差别;未来解决这个问题,提出了一个汇聚特征差分网络(AFD-NET:an aggregatedfeature difference learning network),与其他的方法不同,此方法不仅仅依赖于卷积高级语义特征,并且依...原创 2019-10-25 16:15:26 · 1023 阅读 · 0 评论 -
Cross-Spectral Image Patch Matching by Learning Features of the Spatially Connected Patches 论文阅读
摘要:由于不同的成像原理造成跨光谱图像块的匹配存在困难与挑战;根据不同光谱的成像数据在高级特征桑语义特征存在共同性,(共享语义特征空间)更好的学习,提出了(SCFDM: progressive comparison of spatially connected featuremetric learning with a feature discrimination constrain)使用特征差...原创 2019-10-24 18:59:45 · 426 阅读 · 0 评论 -
Deep Residual Learning for Image Recognition论文阅读
更深层次的神经网络更难训练。我们提出了一个残差学习框架来简化网络的训练,这些网络比以前使用的网络要深入得多。我们显式地将层重新表示为参考层输入的学习剩余函数,而不是学习未引用的函数。我们提供了全面的经验证据表明,这些剩余网络更容易优化,并可以从大幅增加的深度获得精度。在ImageNet数据集上,我们对剩余网进行了评估,其深度可达152层,比VGG网[41]深8层,但仍然具有较低的复杂性。这些残差网...原创 2019-08-13 20:14:42 · 154 阅读 · 0 评论 -
语义分割的发展
思路:对每个像素进行标记,不需要区分实例,只关心像素大的方向是两个,一、对原始图片进行卷积,下采样,然后进行上采样,最终形成与原始图片大小的图片,产生 单通道图像二、直接对原始图片进行卷积 提取特征,然后经过一个 softmax分类器,进行分类,形成单通道的图像介绍几个技术:skip connection 残差连接 主要思想,对图片不同程度的抽取特征,对抽取的特征进行累加...原创 2019-07-16 16:58:35 · 286 阅读 · 0 评论 -
SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation 的理解
一、先来了解一下VGG16的网络结构VGG网络结构图片论文中的不同VGG的模型注释:输入层(input layer)224x224x3 即图像宽高为224,剩下的三个通道对应RGB第一层卷积层,conv1_1:由第一张图,第一层卷积层参数为224x224x64 代表第一层卷积层有224x224x64个神经元,其中,每224x224为一小层神经元,这一小层神经元参...原创 2019-05-27 09:55:22 · 1037 阅读 · 0 评论 -
2019CVPR Deep High-Resolution Representation Learning for Human Pose Estimation 姿态估计01
代码:https://github.com/leoxiaobin/ deep-high-resolution-net.pytorch论文:arXiv:1902.09212v1题目:深度高分辨率特征学习的姿态估计摘要:在文章中,主要提出了从始至终维持着高分辨率的特征的深度学习网络,并对比了现存的高分辨率-低分辨率,低分辨率-高分辨率的深度网络框架,本文提出的高分辨率网络分为几个阶段,以高...原创 2019-08-21 20:23:44 · 537 阅读 · 0 评论 -
经典网络resnet(残差网络) 论文分析01
Deep Residual Learning for Image Recognition摘要:深度神经网络很难训练,我们提出一种残差学习物流框架比之前更深,我们显示重整作为网络的输入,提供了有利的证据表明这种残差网络更容易被训练与优化;在imagenet dataset里面深度是vgg的8倍,取得第一的名次,提出了网络的深度对于识别任务起到重要的作用;1、介绍:随着网络深度的增加,网络会出...原创 2019-08-21 19:28:00 · 3140 阅读 · 0 评论 -
Deep Metric Learning for Visual Understanding(深度度量学习在视觉理解方面的发展)
度量学习旨在学习距离函数来测量相似样本距离,其在很多视觉理解上发挥很大的作用,一般的,最优视觉函数对于不同的理解任务是非常具体的,因为其数据分布在不同的任务中是不同的,普遍认为度量学习训练数据的效果要优于手工设计,比如说欧式距离与余弦距离,大量的度量学习被 提出,并且成功应用于人脸识别 图片分类 视觉跟踪 人体重识别 跨模态配对图片的几何定位。度量学习分为监督与非监督的,非监督度的度量学习尝...原创 2019-09-04 21:57:33 · 1415 阅读 · 0 评论