翻译
文章平均质量分 80
加一点点醋
博士在读
展开
-
MMaction2 使用记录4——模型微调
本教程指导用户使用预先训练好的模型对其他数据集进行微调,以便获得更好的性能。mmaction2原创 2023-07-05 12:22:47 · 597 阅读 · 0 评论 -
MMaction2 使用记录3——数据准备、处理
数据集准备MMAction2支持许多现有的数据集。在本章中,我们将引导您为 MMAction2准备数据集。原创 2023-07-05 11:55:48 · 607 阅读 · 0 评论 -
基于预测帧的视频异常检测经典论文
16年上海科技的论文,上海科技做这个方向的系大佬多多的。摘要受基于稀疏编码的异常检测能力的激励,我们提出了一种时间相干稀疏编码(TSC),其中我们强制用相似的重构系数对相似的相邻帧进行编码。然后,我们用一种特殊类型的层叠递归神经网络来映射旅行商问题。通过利用sRNN同时学习所有参数,可以避免对TSC进行非平凡的超参数选择,同时利用浅层sRNN,可以在前向通路中推断重构系数,从而降低学习稀疏系数的计算成本。本文的贡献有两个方面:1)我们提出了一个可映射到支持向量机神经网络的支持向量机模型,该模型有..原创 2023-07-04 21:33:49 · 211 阅读 · 0 评论 -
MMaction2 使用记录1——训练及测试
mmaction 训练与测试原创 2023-07-04 21:32:01 · 553 阅读 · 0 评论 -
MMaction2 使用记录1——config介绍
MMaction2 使用记录1——config介绍原创 2023-07-04 21:11:57 · 506 阅读 · 0 评论 -
Few-Shot Scene-Adaptive Anomaly Detection 少镜头场景的自适应异常检测
摘要我们解决了视频中的异常检测问题。目标是通过专门从正常视频中学习来自动识别异常行为。大多数现有方法通常需要大量数据,并且泛化能力有限。他们通常需要在目标场景的大量视频上进行训练,才能在该场景中取得良好的效果。在本文中,我们提出了一个新的少镜头场景自适应异常检测问题,以解决以往方法的局限性。我们的目标是学会在以前看不见的只有几帧的场景中检测异常。这个新问题的可靠解决方案在现实世界的应用中将有巨大的潜力,因为为每个目标场景收集大量数据是昂贵的。我们提出了一种基于元学习的方法来解决这个新问题;大量实验结果证原创 2021-04-12 21:35:16 · 1673 阅读 · 2 评论 -
基于距离判定的视频异常事件检测
Real-Time Anomaly Detection and Localization in Crowded ScenesCVPR 2015的一篇文章,相对有点老了,不过最近在研究综述,拿出来简单了解一下结构方法和思想。Abstract本文提出了一种拥挤场景下的实时异常检测与定位方法。每个视频被定义为一组不重叠的立方块,并且使用两个局部和全局描述符来描述。这些描述符从不同方面捕获视频属性。通过结合简单而经济的高斯分类器,我们可以区分视频中的正常活动和异常。局部特征和全局特征基于相邻块之间的结构原创 2021-04-01 16:50:24 · 522 阅读 · 2 评论 -
Learning Memory-guided Normality for Anomaly Detection——学习记忆引导的常态异常检测
又是一篇在自编码器框架中研究使用记忆模块的论文,可以看做19年的iccv的论文的衍生,在我的博客中对19年iccv这篇论文也做了简单介绍。韩国人写的,应该是吧,这名字听起来就像。摘要abstract我们解决异常检测的问题,即检测视频序列中的异常事件。基于卷积神经网络的异常检测方法通常利用代理任务(如重建输入视频帧)来学习描述正常情况的模型,而在训练时看不到异常样本,并在测试时使用重建误差来量化异常的程度。这些方法的主要缺点是没有明确考虑正常模式的多样性,而CNNs强大的表示能力允许重建异常的视频..原创 2021-03-15 15:44:57 · 1802 阅读 · 1 评论 -
Memorizing Normality to Detect Anomaly ——记忆正常以检测异常
Memorizing Normality to Detect Anomaly: Memory-augmented DeepAutoencoder for Unsupervised Anomaly Detection记忆正常检测异常:记忆增强型深度自动编码器无监督异常检测中国人挂了一堆外国人Abstract深度自动编码器在异常检测中得到了广泛的应用。通过对正常数据的训练,期望自动编码器对异常输入产生比正常输入更高的重建误差,并将其作为识别异常的判据。然而,这一假设在实践中并不总是成.原创 2021-03-02 16:56:00 · 1800 阅读 · 0 评论 -
pytorch时空数据处理4——图像转文本/字幕Image-Captionning(二)
pytorch时空数据处理4——图像转文本/字幕Image-Captionning(二)pytorch时空数据处理4——图像转文本/字幕Image-Captionning(二)pytorch时空数据处理4——图像转文本/字幕Image-Captionning(二)书接上文,本篇主要讲解工程代码结构和代码运行。...原创 2021-02-27 11:35:09 · 1866 阅读 · 11 评论 -
REMEMBERING HISTORY WITH CONVOLUTIONAL LSTM FOR ANOMALY DETECTION——利用卷积LSTM记忆历史进行异常检测
上海科技大学的文章,上海科技大学有个组一直在做这方面的工作,好文章挺多的还有数据集。ABSTRACT本文解决了视频中的异常检测问题,由于异常是无界的,所以异常检测是一项极具挑战性的任务。我们通过利用卷积神经网络(CNN或ConvNet)对每一帧进行外观编码,并利用卷积长期记忆(ConvLSTM)来记忆与运动信息相对应的所有过去的帧来完成这项任务。然后将ConvNet和ConvLSTM与自动编码器相结合,即ConvLSTM-AE,学习普通时刻的外观和运动规律。与基于三维卷积自动编码器的异常检测相比..原创 2021-02-22 20:54:32 · 813 阅读 · 0 评论 -
Learning Temporal Regularity in Video Sequences——视频序列的时间规则性学习
Learning Temporal Regularity in Video SequencesCVPR2016 无监督视频异常事件检测早期工作摘要由于对“有意义”的定义不明确以及场景混乱,因此在较长的视频序列中感知有意义的活动是一个具有挑战性的问题。我们通过在非常有限的监督下使用多种来源学习常规运动模式的生成模型(称为规律性)来解决此问题。体来说,我们提出了两种基于自动编码器的方法,以使其能够在很少或没有监督的情况下工作。我们首先利用传统的手工制作的时空局部特征,并在这些特征上学习完全连接的自动原创 2021-02-20 22:14:09 · 1294 阅读 · 1 评论 -
Show,Attend and Tell: Neural Image Caption Generation with Visual Attention
Abstract受机器翻译和对象检测领域最新工作的启发,我们引入了一种基于注意力的模型,该模型可以自动学习描述图像的内容。我们描述了如何使用标准的反向传播技术,以确定性的方式训练模型,并通过最大化变分下界随机地训练模型。我们还通过可视化展示了模型如何能够自动学习将注视固定在显着对象上,同时在输出序列中生成相应的单词。我们通过三个基准数据集(Flickr9k,Flickr30k和MS COCO)的最新性能验证了注意力的使用。1.Intraduction为图像自动生成字幕是一项与场景理解的核心接近的原创 2021-02-20 12:38:04 · 1793 阅读 · 1 评论