自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

清欢

人间有味是清欢

  • 博客(128)
  • 论坛 (1)
  • 收藏
  • 关注

原创 论文阅读汇总

文章目录前言TODO List领域行为识别其他视频理解相关目标检测阅读时间2020.6前言记录一下看的论文,一般都是比较快速的看看,有兴趣的会精读一下。会从两个维度记录一下看的论文。论文领域:如是目标检测、行为识别,还是别的什么。看论文时间的时间点。看每篇论文的时候,主要目标是回答四个问题:要解决什么问题?用了什么方法解决?效果如何?还存在什么问题?TODO ListAnomaly Detection Based on Deep Learning Using V

2020-05-31 23:58:11 660

原创 文章汇总

PythonPython手册(1) Anaconda & pip

2020-05-21 10:16:12 1234

原创 时空行为检测数据集 JHMDB & UCF101_24 详解

文章目录0. 前言1. JHMDB1.1. 基本情况1.2. 数据准备以及标签详解2. UDF101_242.1. 基本情况2.2. 数据准备与标签详解3. 数据集可视化代码0. 前言现在常用的时空行为检测数据集只有AVA/JHMDB/UCF101_24。AVA数据集是每一秒标一帧,更多信息可以参考我的笔记。JHMDB/UCF101_24 是逐帧标注的数据1. JHMDB官网,HMDB官网1.1. 基本情况JHMDB是对HMDB数据集的二次标注,即 joint-annota

2020-11-17 14:06:50 40

原创 ONNX & ONNX Runtime 调研

文章目录0. 前言1. ONNX1.1. 基本情况1.2. 部署工具概述1.3. ONNX文档阅读1.4. 其他小工具2. ONNX Runtime2.1. 基本情况2.2. 各种后端2.3. Python API 的基本使用0. 前言最近要做一些模型推理优化的工作,所以要稍微多学习一点。ONNX其实一直都知道,统一的模型格式,使得模型在各个框架、平台间迁移更方便。1. ONNX官方资料:官网,官方Repo,还有各种repo其他参考资料:ONNX–跨框架的模型中间表达框架1.1. 基本

2020-11-16 17:24:38 16

原创 Transformer - An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&可借鉴之处0. 前言相关资料:arxivgithub,PyTorch论文解读论文基本信息领域:Transformer & CV作者单位:谷歌发表时间:2020.11一句话总结:使用纯Transformer用于图像识别1. 要解决什么问题之前在CV中,attention一般用于卷积网络中,或者用于替换CNN的一部分(但总体还是CNN结构)。2. 用了什

2020-11-16 11:11:35 54

原创 目标检测 - Deformable DETR: Deformable Transformers for End-to-End Object Detection

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&可借鉴之处0. 前言相关资料:arxivgithub,说会release论文解读,知乎讨论论文基本信息领域:目标检测作者单位:商汤发表时间:2020.10一句话总结:在DETR中加入了Deformable1. 要解决什么问题DETR存在一些问题:收敛速度慢(需要训练更多的epochs)Transformer处理图像数据时,feature spatial reso

2020-11-16 01:22:29 53

原创 目标检测 - End-to-End Object Detection with Transformers

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&可借鉴之处0. 前言相关资料:arxivgithub论文解读,知乎讨论,知乎讨论2论文基本信息领域:目标检测作者单位:FAIR发表时间:2020.5一句话总结:提出了一种不同于之前工作的新目标检测解决方案1. 要解决什么问题当前的目标检测解决方案(比如Faster RCNN/YOLO/CenterNet等)都不够直观把检测任务分解为获取候选框/anchors/图像

2020-11-15 14:52:31 16

原创 Transformer - Attention is All you need

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&可借鉴之处0. 前言相关资料:arxivgithub论文解读,论文解读2论文基本信息领域:自然语言处理作者单位:Google发表时间:2017.6一句话总结:Transformer 开山之作1. 要解决什么问题在处理序列数据时,当时常用的结构都是RNN/CNN+Attention。虽然当时都取得了一些进展,sequential computation 的根本问题还存

2020-11-14 12:06:48 13

原创 SlowFast/mmaction2 中的 GradCAM 工具

文章目录0. 前言1. SlowFast 中的 GradCAM1.1. GradCAM的功能1.2. GradCAM 的原理1.3. SlowFast 中的具体实现2. mmaction2 复现 GradCAM 功能2.1. mmaction2 中的 shape2.2. GradCAM 的具体实现2.3. 其他0. 前言最近一直在mmaction2上进行二次开发,有一个需求,想实现一个gradcam工具来分析模型训练结果。目前实现在行为识别模型上的功能实现,已提交PR未来希望能在时空行为检测上实

2020-11-11 13:01:29 58 1

原创 Python基础(11) 性能测试工具 cProfile

文章目录0. 前言1. cProfile 的使用1.1. API 介绍1.2. 单线程使用1.2. 多线程使用2. 结果解释以及可视化2.1. 结果详解2.2. 可视化工具 - snakeviz0. 前言基本需求:统计程序每一部分的运行时间。其实,性能测试应该还包括内存占用统计等,但暂时并不关心。所谓“程序每一部分”有很多中理解,比如按“函数”统计,或按“每行代码”统计。cProfile 就是用按“函数”统计运行时间。cProfile的特点会统计每个函数的总运行时间(包括子函数)、除

2020-11-02 12:42:07 49

原创 Vuepress & Reco主题备忘

文章目录0. 前言1. 感兴趣的功能1.1. 页面介绍1.2. Markdown 编辑功能1.3. Markdown Front Matter 功能1.4. 更多功能2. 进一步配置备忘2.1. 配置文件相关2.2. 目录结构2.3. 静态资源2.4. 特殊页面3. Demo3.1. 基本流程3.2. 碰到的问题0. 前言VuePress文档:英文版,中文版英文版的文档比中文版的新,但大多数内容中文版都有。Reco主题官网注意,Reco 主题知识 VuePress 官方默认主题的扩展,不

2020-10-30 02:32:03 145

原创 行为识别 - Deep Analysis of CNN-based Spatio-temporal Representations for Action Recognition

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&可借鉴之处0. 前言相关资料:arxivgithub论文解读论文基本信息领域:行为识别作者单位:MIT & IBM发表时间:2020.10一句话总结:实验报告,总结现有行为识别模型的特点1. 要解决什么问题当前行为识别模型研究现状:2D模型在Something-Something上效果更好,3D模型在Kinetics上效果更好。现在行为识别模型的对比上

2020-10-27 03:11:32 54

原创 论文管理软件 Zotero 备忘

文章目录0. 前言1. 安装与配置1.1. 安装1.2. 设置数据存放路径1.3. 设置坚果云同步1.4. 设置笔记的Markdown渲染1.5. Sci-Hub 下载论文1.6. 监控文件夹与文件重命名2. 基本使用2.1. 添加item2.2. item管理2.3. 笔记系统2.4. 搜索0. 前言为什么要用论文管理软件?随着论文越看越多,自己使用文件夹管理感觉越来越力不从心。自己最近想要总结一下自己看过的论文,结果发现非常吃力。等待看的论文越来越多,自己使用文档管理感觉非常不方便。

2020-10-26 13:46:40 40

原创 静态网站生成工具备忘

文章目录0. 前言1. 需求分析1.1. 博客/文档基本需求1.2. 网站构建需求2. 常见建站工具概述2.1. 总体评价2.2. Hexo2.3. Vuepress2.4. Docsify2.5. Gitbook0. 前言全文都非常主观。静态网站生成工具是实现自己博客的一种方式。特点:功能齐全、选择多、成本低。一开始配置复杂较复杂,但一旦配置完成后,可专注于内容创作。静态网站生成工具与第三方博客网站(如CSDN/简书/知乎)的比较首先明确一点,第三方博客网站并不是特别好的文

2020-10-16 02:04:11 39

原创 Markdown 编辑器概述

文章目录1. 概述2. Markdown 编辑器 - 作业部落2.1. 概述2.2. 优势与劣势3. Markdown 编辑器 - Typora3.1. 概述3.2. 优势与劣势3.3. 添加新主题3.4. 图片相关设置3.5. 自定义快捷键3.6. 更多内容4. Markdown 编辑器 - VSCode4.1. 概述4.2. 优势与劣势4.3. VSCode 自带功能4.4. Markdown All In One 插件4.5. Markdown Preview Enhanced 插件4.6. mark

2020-10-10 12:35:18 53

原创 Markdown 入门

文章目录0. 前言1. Markdown 基本功能2. Makrdown 编辑器需求分析2.1. 支持代码块/数学公式/快捷键2.2. 导入/分享图片方便2.3. 美观2.4. Markdown 文件转 PDF/HTML3. Markdown 编辑器与文档管理3.1. 纯编辑器3.2. 第三方博客网站3.3. 笔记软件4. 个人建议0. 前言定义:Markdown 轻量级标记语言,即输入纯文本,可通过编辑器等转换成html。为什么要用Markdown首先,强烈建议保持记笔记的习惯,而Markdo

2020-10-10 12:33:45 67

原创 论文浏览(50) RubiksNet: Learnable 3D-Shift for Efficient Video Action Recognition

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxiv,下载github,官网论文解读论文基本信息领域:行为识别作者单位:斯坦福大学 李飞飞组发表时间:ECCV 20201. 要解决什么问题行为识别模型要求大量算力,主要就是对spatial和temporal维度进行卷积操作。最近的关于轻量化模型的研究,一个方向就是将对 spatial 与 temporal 维度上的操作拆

2020-10-05 23:27:57 100

原创 论文浏览(49) Uncertainty-Aware Weakly Supervised Action Detection from Untrimmed Videos

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub论文解读论文基本信息领域:时空行为检测作者单位:Google发表时间:ECCV 20201. 要解决什么问题视频分类的进展十分迅速,但时空行为检测的进展却比较一般作者认为其中一个主要原因是:时空行为检测的数据标注困难较高,需要标注视频中的每一帧图像。2. 用了什么方法目标:只是用 clip-l

2020-10-05 15:47:17 59

原创 论文浏览(48) Online Learnable Keyframe Extraction&Application with Semantic Word Vector in Action Recogn

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言论文名称:Online Learnable Keyframe Extraction in Videos and its Application with Semantic Word Vector in Action Recognition相关资料:arxivgithub论文解读论文基本信息领域:视频理解作者单位:加拿大 University of Albe

2020-10-04 14:39:54 74

原创 论文浏览(47) CFAD: Coarse-to-Fine Action Detector for Spatiotemporal Action Localization

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub论文解读论文基本信息领域:时空行为检测作者单位:上海交大&上海大学发表时间:ECCV 20201. 要解决什么问题之前的 action detection 方法都是先在 frame-wise 或 clip wise 进行检测,得到 action proposals,在连接结果。因为要对每一帧都要进行

2020-09-29 00:52:33 40

原创 论文浏览(46) SpeedNet: Learning the Speediness in Videos

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub,官网论文解读论文基本信息领域:视频理解作者单位:Google发表时间:CVPR 20201. 要解决什么问题预测视频中移动物体的速度。在现实世界中,一个人很容易就能分辨出视频是在快进还是普通速度还是慢放,因为我们都有一些先验知识,即稳重提到的 typical dynamics and natural ra

2020-09-24 18:15:21 84

原创 PyTorch 1.4 源码编译记录

0. 前言目标:在 ubuntu 16.04 上编译PyTorch1.4源码。参考资料:PyTorch 1.4 源码,release链接1. 基本流程参考资料:官方提供了教程只提供了 conda 编译的流程,如果没有conda要从源码编译应该特别麻烦……流程:第一步:安装依赖。公共依赖:conda install numpy ninja pyyaml mkl mkl-include setuptools cmake cffi安装 mega:conda install -c pyt

2020-09-23 00:14:44 40

原创 论文浏览(45) MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:cvpr页面github论文解读(官方解读)论文基本信息领域:行为识别(虽然标题里有tube,但其实做的是行为识别……)作者单位:中国科技大学&微软亚洲研究院发表时间:CVPR 20181. 要解决什么问题3D卷积计算量太大,影响行为识别的效果。当时的3D模型还是C3D,没花头。2. 用了什么方法提出了 Mixe

2020-09-22 15:14:49 68

原创 使用 pre-commit 实现代码检查

文章目录0. 前言1. pre-commit 原理2. pre-commit 的使用2.1. 基本流程2.2. 配置文件编写2.3. 问题与疑问3. mmaction2 的配置文件举例0. 前言需求:希望在提交代码时,对代码的规范进行排查,不符合要求的不让提交。参考资料:官方文档1. pre-commit 原理在 git commit 前进行代码检查的解决方案思路git本身提供了 hook 功能(可参考git相关内容),其中一类就是在commit前调用的,即 .git/hooks/p

2020-09-21 00:05:28 82

原创 Python进阶(10) pytest

文章目录0. 前言1. 命令与配置1.1. pytest 的基本使用1.2. 配置文件2. 代码编写2.1. 推荐的单元测试源码格式2.2. 文件/类/方法命名规则2.3. assert 相关2.4. pytest fixtures0. 前言简介:pytest是Python的测试框架,是第三方提供的,需要额外安装包。安装方法:pip install -U pytest,之后就可以通过 pytest --version 来检查是否安装。官方资料:官方文档1. 命令与配置1.1. pytes

2020-09-19 14:40:58 32

原创 论文浏览(44) Towards Efficient Coarse-to-Fine Networks for Action and Gesture Recognition

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:pdf下载github论文解读论文基本信息领域:行为识别作者单位:加拿大华为诺亚实验室发表时间:ECCV 20201. 要解决什么问题现在的行为识别模型很多,也尽可能做小。但是,当前最优代表性的小模型TSM也需要较多算力。用了一个我没看懂的方法算了一下,在手机上运行TSM的小模型大概能够连续运行15分钟。2. 用了什么

2020-09-17 00:41:26 48

原创 论文浏览(43) oops! Predicting Unintentional Action in Video

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub论文解读官方网站论文基本信息领域:行为识别数据集作者单位:哥伦比亚大学发表时间:CVPR20201. 要解决什么问题之前的工作主要是预测原子动作。2. 用了什么方法提出了 Oops 数据集,该数据及可以实现三类功能判断动作是否是故意的(intentionality)判断出现 inteniona

2020-09-15 13:27:10 35

原创 论文浏览(42) Action Genome: Actions as Composition of Spatio-temporal Scene Graphs

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub官网论文解读论文基本信息领域:时空行为检测作者单位:斯坦福大学发表时间:CVPR 20201. 要解决什么问题在计算机视觉中,我们将行为(actions or activities)作为一个完整的整体。但其实在认知科学(Cognitive Science)和神经学的研究中发现,人的行为被编码为一个 hier

2020-09-14 15:04:23 49

原创 论文浏览(41) STEP: Spatio-Temporal Progressive Learning for Video Action Detection

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub论文解读论文基本信息领域:时空行为检测作者单位:马里兰大学 & NVidia发表时间:CVPR 20191. 要解决什么问题Spatio-temporal action detection 任务的难度较大一个action tube一般来说包括了空间上的变换,这会导致proposal的生成与微调更有难

2020-09-10 17:19:21 63

原创 论文浏览(40) Video Action Transformer Network

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub(非官方代码,只有结构没有结果)论文解读项目网站论文基本信息领域:时空行为检测作者单位:卡耐基梅隆大学 & DeepMind发表时间:CVPR 20191. 要解决什么问题就是想把 Transformer 的思路引入时空行为检测中。判断人的行为之所以困难,有一步分原因在于行为类别需要依赖于目标人物周

2020-09-10 10:55:44 56

原创 论文浏览(39) Action Tubelet Detector for Spatio-Temporal Action Localization

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub(CAFFE)论文解读论文基本信息领域:时空行为检测作者单位:格勒诺布尔大学 & 爱丁堡大学发表时间:CVPR 20171. 要解决什么问题之前的时空检测模型都是先检测frame的结果,然后再link。单独处理每一帧图片并不是最优方法。没有完全利用到视频的连续性(temporal continui

2020-09-09 14:37:37 93

原创 论文浏览(38) Tube Convolutional Neural Network (T-CNN) for Action Detection in Videos

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub(CAFFE)论文解读论文基本信息领域:时空行为检测作者单位:University of Central Florida(简称UCF,这名字,数据集啊)发表时间:2017 CVPR1. 要解决什么问题属于早期的基于检测的时空行为检测,探索了基于Faster R-CNN的时序行为检测方法。2. 用了什么方法

2020-09-08 18:21:55 293

原创 论文浏览(37) Online Real-time Multiple Spatiotemporal Action Localisation and Prediction

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub论文解读论文基本信息领域:时空行为检测作者单位:Oxford Brookes University发表时间:CVPR 20171. 要解决什么问题要解决的是实时场景下的时空行为检测问题,主要问题是:现有时空行为检测的工作都是offline的,不支持online。(虽然论文是2017年的,但其实到目前为止,主

2020-09-08 16:25:15 66

原创 论文浏览(36) Finding Action Tubes with a Sparse-to-Dense Framework

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub论文解读论文基本信息领域:时空行为检测作者单位:上海交大&上海大学发表时间:AAAI 20201. 要解决什么问题之前主流的时空行为检测方法框架如下上述框架的主要流程是基于检测的首先,通过短期信息(从帧或小片段)获取人物的信息。之后,通过启发式算法,对不同帧的bbox进行关联。上述框架存在

2020-09-07 01:16:20 85

原创 cmake Tutorial 摘要(1) Step1-6

文章目录0. 前言Step 1 - A Basic Starting Point1.1. 基本功能1.2. 添加版本号1.3. 设置C++标准Step 2 - Adding a Library2.1. 基本功能2.2. 其他功能Step 3 - Adding Usage Requirements for LibraryStep 4 - Installing and Testing4.1. install4.2. TestingStep 5 - Adding System Introspection5.1.

2020-09-02 15:16:49 20

原创 《Cmake 实践》摘要

文章目录前言第三章 初试cmake3.1. 源码3.2. 基本操作流程3.3. CMakeLists.txt 文件的解释3.4. 基本语法规则3.5. 内部构建与外部构建第四章 更好一点的Hello World4.1. 源码4.2. 目标以及源码解释4.3. INSTALL 命令详解第五章 静态库与动态库构建5.1. 源码5.2. ADD_LIBRARY & SET_TARGET_PROPERTIES 解析第六章 如何使用外部共享库和头文件6.1. 源码6.2. `INCLUDE_DIRECTORI

2020-08-31 11:42:33 23

原创 论文浏览(35) You Only Watch Once

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub论文解读论文基本信息领域:时空行为检测作者单位:慕尼黑工业大学发表时间:2019.111. 要解决什么问题主流的时空行为检测方法使用的是类似 Faster R-CNN 的结构,这种方法的主要流程是:第一步,生成一系列proposals。第二步,对生成的proposals执行分类操作,并进行 localiz

2020-08-27 15:06:25 99 2

原创 论文浏览(34) Spatiotemporal Action Recognition in Restaurant Videos

文章目录0. 前言1. 要解决什么问题2. 用了什么方法3. 效果如何4. 还存在什么问题&有什么可以借鉴0. 前言相关资料:arxivgithub论文解读相关项目论文基本信息领域:时空行为检测作者单位:卡耐基梅隆大学发表时间:2020.81. 要解决什么问题更像是技术报告。使用不同的时空行为检测方法,在一个非标准的数据集(也就是他们自己的一个餐厅数据集上),构建一个产品(production application)使用的这个餐厅数据集,无法下载,

2020-08-26 11:52:37 90

原创 论文浏览(33) Accuracy and Performance Comparison of Video Action Recognition Approaches

文章目录0. 前言1. 要解决什么问题2. 主要内容2.1. 常用数据集2.2. 行为识别模型2.3. 性能指标2.4. 实验设计2.5. 结果讨论0. 前言相关资料:arxivgithub论文解读论文基本信息领域:行为识别作者单位:MIT发表时间:2020.81. 要解决什么问题技术报告。总结了常用方法,直接对比了性能(accuracy与computational performance)。2. 主要内容主要内容包括选择一个合适的数据集,用来比较

2020-08-23 21:24:23 65

原创 Introduction to Graph Neural Networks 摘要(1) 预备知识

文章目录0. 前言1. Introduction1.0. 图的基本概念1.1. 为什么要设计GCN1.2. 相关工作2. Basics of Math and Graph2.1. 线性代数2.2. 概率论2.3. 图论3. Basics of Neural Networks3.1. 神经元3.2. 反向传播3.3. 神经网络0. 前言《Introduction to Graph Neural Networks》是清华大学刘知远教授在2020年3月发布的新书。本书简介可通过Sci-Hub免费下载

2020-08-22 17:44:01 279

空空如也

How Tomcat Works中第二章提到的一个问题

发表于 2016-12-14 最后回复 2016-12-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除