深度学习
文章平均质量分 83
LanceHang
这个作者很懒,什么都没留下…
展开
-
STI-Net: Spatiotemporal integration network for video saliency detection总结整理
为了为了帮助网络优化并随着网络深度的增加获得更准确的结果,K. He, X. Zhang, S. Ren, J. Sun, Deep residual learning for image recognition, in: Computer Vision and Pattern Recognition, CVPR, IEEE, 2016, pp. 770–778.中采用的快捷连接被施加在位于特征聚合和显著性融合步骤中的卷积块上,即Conv-B1和Conv-B3。引入了循环连接,以进一步加速深度功能的交互。原创 2023-07-10 16:28:41 · 350 阅读 · 0 评论 -
A Novel Long-Term Iterative Mining Scheme for Video Salient Object Detection总结整理
问题如今VSOD已经是计算机视觉内一个很重要的领域,如今最先进的VSOD模型大多遵循短期的方法。那么什么是这种短期的方法呢?它是指仅考虑当前有限的连续帧去动态的确定空间和时间显著性融合之间的平衡。但是,这种短期的方法是有一定局限性的,那么这种局限性是什么呢?这是因为我们的视觉系统是一个典型的长期方法,因此这些VSOD方法所用的短期方法是与真实的视觉系统机制起冲突的。因此当前流行的模型得到的结果往往是失败的。解决那既然知道了这个问题,所以本文提出了一个长期的方法。那如何实现长期的方法呢?原创 2023-04-24 14:53:47 · 212 阅读 · 0 评论 -
Part-aware attention correctness for video salient object detection笔记总结
问题:在以往的VSOD中,一般主要是研究时空结构,利用隐式注意力模型去聚合相邻视频帧的互补信息。但很少有方法去关注跨视频帧的亲和力,即建立显式注意力图式去完成VSOD。解决:提出一个新的注意力正确性策略去监督聚合过程。具体实现:采用成对训练模式,利用积极和消极的聚合监督去探索VSOD的视频间亲和力。该方法的优点:成功抑制视频帧的负对应,增强了对显著对象的判别(区分性)特征的挖掘。优化:为了增强视频内的一致性,提出了部分感知的相似性聚合模块,帮助视频内的亲和力去分割视频级上下文的显著对象。原创 2023-04-18 20:57:46 · 382 阅读 · 0 评论 -
Learning Video Salient Object Detection Progressively from Unlabeled Videos笔记总结
那么如何去实现无标签数据的视频显著性检测呢?本文想到一个方法,即渐进式的,先定位显著对象后分割显著对象。而定位显著对象我们可以在SOD上完成,但由于SOD中是缺乏动态的运动信息的,因此可以在SOD期间引入动态显著性,但保留相同的精细分割过程。具体过程其实是一个生成时空位置标签的算法,该算法可以生成高显著性的位置标签并且跟踪相邻帧的显著对象。接着根据这些生成的标签,利用一个双流定位网络,引入一个光流分支去完成视频显著对象定位。上面也说了,该算法由图像SOD、生成时空位置标签和VSOD组成。原创 2023-04-04 10:00:09 · 495 阅读 · 0 评论 -
Shifting More Attention to Video Salient Object Detection笔记
该论文类似一个视频显著性检测的综述测评。本文对8种用于视频显著性检测的数据集以及17种比较先进的视频显著性检测算法进行了对比分析另外本文也有自己的特点:①本文构建了用于视频显著性检测的大规模的稠密标注的视频显著对象检测(DAVSOD)数据集。②本文还提出了一种面向显著性转移的VSOD(SSAV)的模型。原创 2023-03-21 18:40:18 · 919 阅读 · 0 评论 -
基于深度学习的视频显著性检测学习(入门)
该算法的特点是:①充分考虑特征聚合过程中特征之间的差异,由于聚合过程如果只是自上而下或自下而上就容易忽略高分辨率低语义的下层部分或低分辨率高语义的上层部分。而该算法通过整合自上而下的输出和自下而上的输出,充分考虑各层次的特征差异。②利用双层ConvLSTM考虑了远距离帧之间的时间相关性。该模型实际上是先提取更加丰富的边缘特征,接着用该特征引导空间,指导空间显著性的特征提取,最后用两组卷积LSTM分别处理空间高级特征和空间边缘特征,得到的结果融合达到视频显著性检测效果。原创 2023-03-13 10:42:08 · 1326 阅读 · 0 评论 -
Video Salient Object Detection via学习笔记
本文主要是针对视频显著性检测遇到的两个问题:①在进行基于深度学习的视频显著性检测时缺少足够多的已经标记的像素级数据。②如何提高加快视频显著性检测和训练。针对这两个问题有相应的解决方案:①提出一个网络,该网络有两个模块分别提取空间信息和时间信息。动态显著性模型可以合并静态显著模型的显著性估计,直接产生时空显著性推断而不需要耗时的光流计算。那么该方案如何实现?A:研究卷积神经网络在动态场景中端到端训练和像素显著性预测。原创 2023-03-13 10:40:30 · 159 阅读 · 0 评论 -
浅谈目标跟踪及对SPM-tracker论文的简单理解
SPM追踪器为什么写这个追踪器算法?之前对目标跟踪是完全不了解的,但这次老师给的作业是从一些计算机视觉论文中抽取一篇进行分析,抽到了这个。虽然这个不是特别经典的算法,但了解过后发现通过对他了解的过程让我学到了很多。目录什么是目标跟踪?如何实现目标跟踪?SPM的摘要简介。SPM算法的框架流程?SPM的特点?一、什么是目标跟踪?网上关于目标跟踪的内容有很多,我这里只做简单介绍。首先,我们都知道目标检测,给定一张图像经过运算后我们能够检测到图像中出现的人脸(可以参考我之前写的MTCNN)。原创 2020-12-17 15:06:55 · 1026 阅读 · 0 评论 -
MTCNN算法的理解介绍及代码分析(2)
代码地址这里走的是一个github上的代码mtcnn-pytorch运行效果如下是效果图,我们可以看到对一张图片内的每一张人脸进行检测,每个人脸有一个边界框与五个标记点。这里我们使用cv来实现图片显示,以下是TEST.py文件,首先从src目录下的detector文件中导入detect_faces函数,从visualization——utils中导入show_bboxes函数.用Image打开图片,这时图片的输出类型是<class’PIL.JpegImagePlugin.JpegIma原创 2020-12-12 23:05:10 · 708 阅读 · 1 评论 -
MTCNN算法的理解介绍及代码分析(1)
为什么要用MTCNN在我们进行人脸识别过程中,同一个人在不同的图像中可能有不同的动作与表情,所以必须将人脸图像变换到一个统一的角度和姿态。而要实现这一功能的关键就是找到人脸的若干个关键点,然后利用这些关键点通过旋转,缩放,平移等手段将人脸变化到标准人脸。而MTCNN就可以完成人脸定位和人脸对齐。算法框架MTCNN基本流程1.给定一张图像,进行放缩生成不同大小的图像,构建图像金字塔。因为在我们测试输入时,输入的数据可能是不同尺寸的,所以为了适应不同尺寸的头像,会按不同的比例缩放得到金字塔。2.利用原创 2020-12-10 01:04:56 · 864 阅读 · 0 评论 -
pytorch深度学习笔记(4)------迁移学习与数据增强
迁移学习在我们学习深度学习的过程中,往往需要大数据,深网络。但有时我们很难同时获取这些条件。这时我们可以使用其他任务开发的模型来应用于我们自己的任务。而这,就是迁移学习。迁移学习是机器学习的一种方法,可以将预训练的模型作为新模型的起点,这些预训练的模型在开发神经网络的时候已经在大数据集上训练好,模型的设计也好,因此我们有时候可以拿来使用。另外我们有时候需要针对很多任务训练不同的模型,这样很浪费资源。合理使用迁移学习,可以使一个模型适用于多个任务,节约了计算资源。迁移学习就是把预训练好的模型迁移到新的原创 2020-11-28 14:58:29 · 1481 阅读 · 2 评论 -
pytorch深度学习笔记(3)------CIFAR-10多分类(包含CIFAR10下载)
CIFAR-10首先说一下CIFAR-10,它是一个数据集。由10个类的60000个32×32彩色图像组成。每个类有6000个图像。共有50000个训练图像和10000个测试图像。加载数据并导入库import torchimport torchvisionimport torchvision.transforms as transformstransform = transforms.Compose( [transforms.ToTensor(),transforms.Normal原创 2020-11-28 13:54:05 · 370 阅读 · 0 评论 -
pytorch深度学习笔记(1)---使用Numpy实现机器学习
机器学习在学习pytorch前,我们首先需要知道什么是机器学习。直观的看,机器学习就是让机器去学习。而且,确实就是这样,机器学习就是让机器具备学习的能力。机器学习分为训练和测试两个过程,所谓训练就是给机器一些数据,让它自己生成一种模型,所谓测试就是利用训练到的模型去预测其他的非训练数据。在第一次学习过程中,先利用Numpy实现一个简单的机器学习案例。我们已经知道,机器学习需要我们去训练出一个模型。而在我们中学求导时,总会有这么一道题,给定几个点,让我们去通过这几个点求一个函数的方程式。然后用得到的原创 2020-11-17 22:56:44 · 406 阅读 · 0 评论 -
pytorch深度学习笔记(2)------手写数字识别(卷积)
手写数字识别可以说是学习深度学习的第一个代码了,相当于我们学习其他语言时的Hello World。在这里,我们要利用卷积来构建神经网络去完成手写数字识别案例。卷积CNN原创 2020-11-15 14:16:00 · 307 阅读 · 1 评论