volcano_Lin-CSDN博客

原创【汇总】行为识别、时序行为检测、弱监督行为检测、时空行为定位论文代码（持续更新！！！）

视频行为识别与轻量化网络的前沿论文、代码等https://zhuanlan.zhihu.com/c_1207774575393865728CVPR 2020 行为识别/视频理解论文汇总https://zhuanlan.zhihu.com/p/141429177CVPR 2020 论文大盘点-动作识别篇https://cloud.tencent.com/developer/article/1664055CVPR 2020 论文大盘点-动作检测与动作分割篇https://www.sohu.com/

2020-12-08 14:57:07 3743 1

原创深度学习：YOLO v3（darknet）——训练自己的VOC数据

论文：YOLOv3: An Incremental Improvement 论文地址：https://pjreddie.com/media/files/papers/YOLOv3.pdfdarknet代码：https://github.com/AlexeyAB/darknet#how-to-compile-on-linux 本文配置的方法也主要是参考 https://github...

2018-10-23 21:37:32 12402 11

原创行人重识别（Person Re-ID）【一】：常用评测指标

1、gallery和probe：gallery是候选行人库，probe是待查询输入，也叫查询图像（query）。 2、single shot 和muti shot：前者是指gallery中每个人的图像为一张（N=1），而后者是指gallery中每个人的图像为N>1张图像，同样的Rank-1下，一般N越大，得到的识别率越高。 3、rank-n：...

2018-10-10 18:01:45 8608

原创 caffe深度学习【十三】：Caffe的 solver 参数详解

简述：相信跑过caffe框架的同学都知道一般进行训练，我们都需要如下几个文件/文件夹：1）models文件夹就是存放训练得到的模型，也就是保存网络中的各种W和b的参数2）train-SE.sh 其实就是一个脚本文件，里面写上类似这样的：/home/lincanran/caffe/.build_release/tools/caffe train -solver=/h...

2018-08-30 19:47:55 806

转载行人重识别（Person Re-ID）【二】：基于深度学习的行人重识别研究综述

本文转载自：https://zhuanlan.zhihu.com/p/31921944 前言：行人重识别（Person Re-identification）也称行人再识别，本文简称为ReID，是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题。给定一个监控行人图像，检索跨设备下的该行人图像。在监控视频中，由于相机分辨率和拍摄角度的缘故，通...

2018-08-29 10:50:55 3220 2

原创 caffe深度学习【九】目标检测 yolo v1的caffe实现基于VOC2007数据集

YOLO v1算法原文的作者是在darknet框架下实现的，原文作者的实现，这里主要讲的是caffe版本的YOLO实现，主要采用yeahkun写的：点击打开链接其实只是步骤相对来说有点繁琐，但是要跑通并不困难：大致步骤包括：1、编译caffe-yolo 2、下载VOC2007数据集 3、生成list文件4、生成LMDB文件5、训练6、测试...

2018-08-08 20:23:51 2327 11

原创 ubuntu(linux)系统查看文件夹下有多少文件

1. 查看当前目录所有文件和文件夹的大小方法一：du−sh∗或du -h -d 0 *'-d 0' 代表查询目录的深度为0 ，也就是当前目录，'-d 3' 表示文件目录深度为3，可以查到当前目录下的1~3级目录。方法二：ls−lh或ls -lht2. 查看并统计文件和文件夹数目统计当前目录下文件数目：$ls -l | grep '^-' | wc -l统计当前目录及所有子目录下文件数目：$ls -lR | grep '^-' | wc -l统计当前目录...

2021-05-24 14:17:43 5393

原创 Windows下通过VNC访问Linux服务器(可视化界面)

问题：实习公司用的是服务器，我们只能使用SecureCRT通过指令进行类似linux系统下终端的指令操作，如下图：而上传文件就要通过WinSCP：一般的工作，不需要可视化界面也能完成可是，当我们有些操作需要显示出来，就有问题了，例如我们训练完ssd，想在图片或者视频上测试，看看效果：没办法显示！！所以，我就想实现服务器也能可视化！VN...

2020-06-04 10:00:53 105410 23

原创 python cv2视频抽帧保存

import cv2import osimport shutil#input videofilename = '20190327.mp4'savedpath = filename.split('.')[0] + '/'isExists = os.path.exists(savedpath)if not isExists: os.makedir...

2019-03-27 16:43:13 3971 3

原创 ImportError: No module named 'torchsample' 问题解决方案

在跑pytorch代码时候遇到这个问题:ImportError: No module named 'torchsample' 安装相关依赖即可：如果没有装git的同学，要先装上git：pip3 install gitpip3 install -e git+https://github.com/ncullen93/torchsample.git#egg=torch...

2019-03-08 10:35:48 5450

原创 ffmpeg（ubuntu16.04）：视频抽成帧（图片）/图片合成视频

· 视频抽成帧（图片）：cd 到视频所在目录下；输入：ffmpeg -i output-processed.avi -q:v 2 -f image2 frame_%06d.jpg（注：上述代码中， -i 是用来获取输入的文件，-i “*.avi” 就是获取这个叫做星号的avi视频文件；此外还有一些参数：-r 是设置每秒提取图片的帧数，-r 1的意思就是设置为每秒获取一帧...

2019-02-28 17:43:22 2547

原创如何在linux下解压 .solitairetheme8 文件

我们从Nvidia官网上下载下来的cudnn for linux的文件格式是.solitairetheme8，想要解压的话需要先转成tgz格式再解压： cp cudnn-8.0-linux-x64-v5.1.solitairetheme8 cudnn-8.0-linux-x64-v5.1.tgztar -xvf cudnn-8.0-linux-x64-v5.1.tgz ...

2018-12-29 16:04:04 7415 1

原创 python opencv获取视频属性方法

如果我们想知道一个视频的总帧数，可以借助opencv来实现： import cv2#path就是你的视频的地址，记得加引号cap=cv2.VideoCapture(path)#get方法参数按顺序对应下表（从0开始编号，比如这里为了获取视频的总帧数，在下表是排第八个的，不过cap.get里面的参数是从0开始计起frames_num=cap.get(7)print(frames_...

2018-11-27 21:49:05 4199

原创 caffe深度学习【十八】Check failed: error == cudaSuccess (8 vs. 0) invalid device function

今天想跑一下行为识别的C3D算法，但是发现出现如下错误：Check failed: error == cudaSuccess (8 vs. 0) invalid device function 查了下原因，网上说是最大能力编译版本不对，如果提示invaild argument，说明batchsize还是太大了，爆了缓存而我的是invalid device functi...

2018-11-26 16:35:56 2332

原创 Ubuntu16.04下安装ffmpeg

想跑行为识别的iDT算法时，需要依赖两个库：OpenCV: readme中推荐用2.4.2，实际上用最新的2.4.13也没问题。但OpenCV3就不知道能不能用了，没有试过。 ffmpeg: readme中推荐用0.11.1。实际上装最新的版本也没有问题OpenCV很多人应该都装好的了FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。采用LGPL或...

2018-11-22 09:47:21 1299

原创 LeetCode 17 电话号码的字母组合（字符串、回溯算法Backtracking、递归Recursive）

题目要求：给定一个仅包含数字 2-9 的字符串，返回所有它能表示的字母组合。给出数字到字母的映射如下（与电话按键相同）。注意 1 不对应任何字母。示例:输入："23"输出：["ad", "ae", "af", "bd", "be", "bf", "cd", "ce", "cf"].说

2018-11-17 14:56:36 707 1

原创人脸检测SSH（Single Stage Headless Face Detector）配置方法（caffe版）

SSH: Single Stage Headless Face Detector这篇是ICCV2017关于人脸检测的文章，提出SSH（single stage headless）算法有效提高了人脸检测的效果，主要改进点包括多尺度检测、引入更多的上下文信息、损失函数的分组传递等论文链接：https://arxiv.org/abs/1708.03979源码链接：https://github...

2018-11-16 17:38:39 1572 4

原创 LeetCode 16 最接近的三数之和（数组、双指针）

题目要求：给定一个包括 n 个整数的数组 nums 和一个目标值 target。找出 nums 中的三个整数，使得它们的和与 target 最接近。返回这三个数的和。假定每组输入只存在唯一答案。例如，给定数组 nums = [-1，2，1，-4], 和 target = 1.与 target 最接近的三个数的和为 2. (-1 + 2 + 1 = 2). C++...

2018-11-15 17:05:42 171

原创 LeetCode 15 三数之和（数组、双指针）

题目要求：给定一个包含 n 个整数的数组 nums，判断 nums 中是否存在三个元素 a，b，c ，使得 a + b + c = 0 ？找出所有满足条件且不重复的三元组。注意：答案中不可以包含重复的三元组。例如, 给定数组 nums = [-1, 0, 1, 2, -1, -4]，满足要求的三元组集合为：[ [-1, 0, 1], [-1, -1, 2]] ...

2018-11-15 16:25:54 293

转载人脸识别之人脸识别技术综述

参考：http://www.xuehuile.com/thesis/9a81f680054441ad907934b07b465c8e.html，本文做了相关修改。1　人脸识别技术概述近年来，随着计算机技术的迅速发展，人脸自动识别技术得到广泛研究与开发，人脸识别成为近30年里模式识别和图像处理中最热门的研究主题之一。人脸识别的目的是从人脸图像中抽取人的个性化特征，并以此来识别人的身份...

2018-11-14 16:40:59 10036

原创 LeetCode 14 最长公共前缀（字符串）

题目要求：编写一个函数来查找字符串数组中的最长公共前缀。如果不存在公共前缀，返回空字符串 ""。示例 1:输入: ["flower","flow","flight"]输出: "fl"示例 2:输入: ["dog","racecar","car"]输出: ""解释: 输入不存在公共前缀。说明:

2018-11-14 16:24:05 298

原创 LeetCode 13 罗马数字转整数（字符串）

题目要求：罗马数字包含以下七种字符: I， V， X， L，C，D 和 M。字符数值I 1V 5X 10L 50C 100D 500M 1000例如，罗马数字 2 写做 II ，即为...

2018-11-14 11:13:50 263

原创 LeetCode 12 整数转罗马数字（字符串）

题目要求：罗马数字包含以下七种字符： I， V， X， L，C，D 和 M。字符数值I 1V 5X 10L 50C 100D 500M 1000例如，罗马数字 2 写做 II ，即为...

2018-11-14 10:20:49 231

原创 LeetCode 11 盛最多水的容器（数组、双指针）

题目要求：给定 n 个非负整数 a1，a2，...，an，每个数代表坐标中的一个点 (i, ai) 。在坐标内画 n 条垂直线，垂直线 i 的两个端点分别为 (i, ai) 和 (i, 0)。找出其中的两条线，使得它们与 x 轴共同构成的容器可以容纳最多的水。说明：你不能倾斜容器，且 n 的值至少为 2。图中垂直线代表输入数组 [1,8,6,2,5,4,8,3,7]。在此情况下，容...

2018-11-13 21:49:55 165

原创 LeetCode 9 回文数

题目要求：判断一个整数是否是回文数。回文数是指正序（从左向右）和倒序（从右向左）读都是一样的整数。示例 1:输入: 121输出: true示例 2:输入: -121输出: false解释: 从左向右读, 为 -121 。从右向左读, 为 121- 。因此它不是一个回文数。示例 3:输入: 10输出: false解释: 从右向左读, 为 01 。因此它不...

2018-11-13 20:56:10 154

原创 LeetCode 8 字符串转整数 (atoi)

题目要求：实现 atoi，将字符串转为整数。该函数首先根据需要丢弃任意多的空格字符，直到找到第一个非空格字符为止。如果第一个非空字符是正号或负号，选取该符号，并将其与后面尽可能多的连续的数字组合起来，这部分字符即为整数的值。如果第一个非空字符是数字，则直接将其与之后连续的数字字符组合起来，形成整数。字符串可以在形成整数的字符后面包括多余的字符，这些字符可以被忽略，它们对于函数没有影响。...

2018-11-12 10:20:28 107

原创 LeetCode 7 反转整数

题目要求：给定一个 32 位有符号整数，将整数中的数字进行反转。示例 1:输入: 123输出: 321示例 2:输入: -123输出: -321示例 3:输入: 120输出: 21注意:假设我们的环境只能存储 32 位有符号整数，其数值范围是。根据这个假设，如果反转后的整数溢出，则返回 0。 C++代码1：#define I...

2018-11-07 17:52:26 142

原创 LeetCode 6 Z字形变换(字符串)

题目要求：将字符串 "PAYPALISHIRING" 以Z字形排列成给定的行数：P A H NA P L S I I GY I R之后从左往右，逐行读取字符："PAHNAPLSIIGYIR"实现一个将字符串进行指定行数变换的函数:string convert(string s, int numRows);示例 1:输入: s = "PAYP...

2018-11-07 16:26:12 223

原创 LeetCode 5 最长回文子串(字符串、中心扩展)

题目要求：给定一个字符串 s，找到 s 中最长的回文子串。你可以假设 s 的最大长度为1000。示例 1：输入: "babad"输出: "bab"注意: "aba"也是一个有效答案。示例 2：输入: "cbbd"输出: "bb" 1.暴力解法最容易想到的就是暴力解法，找出所有的子串，然后再一个个去判断是不是回文，然后再从中找到最长的那个。求每一个...

2018-11-07 14:28:19 554

原创 LeetCode 4 两个排序数组的中位数(数组、二分查找、分治法)

题目要求：给定两个大小为 m 和 n 的有序数组 nums1 和 nums2 。请找出这两个有序数组的中位数。要求算法的时间复杂度为 O(log (m+n)) 。你可以假设 nums1 和 nums2 不同时为空。示例 1:nums1 = [1, 3]nums2 = [2]中位数是 2.0示例 2:nums1 = [1, 2]nums2 = [3, 4]...

2018-11-06 20:41:59 1493

原创 LeetCode 3 无重复字符的最长子串(哈希表或数组)

题目要求：给定一个字符串，找出不含有重复字符的最长子串的长度。示例 1:输入: "abcabcbb"输出: 3 解释: 无重复字符的最长子串是 "abc"，其长度为 3。示例 2:输入: "bbbbb"输出: 1解释: 无重复字符的最长子串是 "b"，其长度为 1。示例 3:输入: "pwwkew"输出: 3解释: 无重复字符的最长子串是 "wke&qu

2018-11-06 10:59:35 1140

原创 LeetCode 2 两数相加(链表)

题目要求：给定两个非空链表来表示两个非负整数。位数按照逆序方式存储，它们的每个节点只存储单个数字。将两数相加返回一个新的链表。你可以假设除了数字 0 之外，这两个数字都不会以零开头。示例：输入：(2 -> 4 -> 3) + (5 -> 6 -> 4)输出：7 -> 0 -> 8原因：342 + 465 = 807 C++代码...

2018-11-05 23:15:04 2641

原创 LeetCode 1 两数之和（哈希表、unordered_map）

题目要求：给定一个整数数组和一个目标值，找出数组中和为目标值的两个数。你可以假设每个输入只对应一种答案，且同样的元素不能被重复利用。示例:给定 nums = [2, 7, 11, 15], target = 9因为 nums[0] + nums[1] = 2 + 7 = 9所以返回 [0, 1] C++代码(8ms)：class Solution ...

2018-11-05 16:01:58 2581

原创 unordered_map的用法

unordered_map介绍：无序映射是关联容器，用于存储由键值和映射值组合而成的元素，并允许基于键快速检索各个元素。在unordered_map中，键值通常用于唯一标识元素，而映射值是与该键关联的内容的对象。键和映射值的类型可能不同。在内部，unordered_map中的元素没有按照它们的键值或映射值的任何顺序排序，而是根据它们的散列值组织成桶以允许通过它们的键值直接快速访问单个...

2018-11-05 14:58:38 3787

原创行人重识别（Person Re-ID）【五】：论文笔记——Pose-Normalized Image Generation for Person Re-identification

论文：Pose-Normalized Image Generation for Person Re-identification链接：http://openaccess.thecvf.com/content_ECCV_2018/papers/Xuelin_Qian_Pose-Normalized_Image_Generation_ECCV_2018_paper.pdf代码：暂无 ...

2018-10-29 16:49:02 2680 2

原创行人重识别（Person Re-ID）【四】：论文笔记——Beyond Part Models: Person Retrieval with Refined Part Pooling

论文：Beyond Part Models: Person Retrieval with Refined Part Pooling链接：http://openaccess.thecvf.com/content_ECCV_2018/papers/Yifan_Sun_Beyond_Part_Models_ECCV_2018_paper.pdf代码：https://github.com/syfa...

2018-10-24 15:12:06 6772 1

原创 Ubuntu（Linux）系统下如何查看自己安装的CUDA和CUDNN的版本

一、查看 CUDA 版本：cat /usr/local/cuda/version.txt我的是8.0.61 二、查看 CUDNN 版本：cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2我的是6.0.21

2018-10-23 10:03:11 46190 11

原创行人重识别（Person Re-ID）【三】：论文笔记——Joint Detection and Identification Feature Learning for Person Search

论文：Joint Detection and Identification Feature Learning for Person Search链接：https://arxiv.org/abs/1604.01850 前言：这篇是CVPR2017关于行人重识别（Person Re-ID）的文章，由港中文、中山大学和商汤联合提出。本文主要提出了一种行人搜索的新框架，把传统的两门独立的研究...

2018-10-14 15:45:55 9430

原创 Windows下的labelme数据标注工具安装教程

前言因为最近要做一个目标检测的比赛，需要用到labelme这款开源标注工具，所以安装了下具体的的安装步骤可参考：https://github.com/wkentaro/labelme因为我是在Windows下使用的，所以这里只介绍了Windows的安装方法，Ubuntu、macOS等其他系统在上面的github都有详细介绍，大家自行查看哈一、安装AnacondaWindo...

2018-10-13 11:21:18 52562 32

原创 caffe深度学习【十七】配置MobileNet，caffe添加ConvolutionDepthwise层

背景：论文入口：https://arxiv.org/abs/1704.04861配置文件下载入口：https://github.com/farmingyard/caffe-mobilenet 在caffe版本的MobileNet 和ShuufleNet中，我们会用到ConvolutionDepthwise层，即深度可分离卷积。Caffe原本的框架里是没有Convolut...

2018-09-12 16:39:38 7295 11

opencv-离散傅里叶变换

离散傅里叶变换(DFT)，是傅里叶变换在时域和频域上都呈现离散的形式，将时域信号的采样变换为在离散时间傅里叶变换(DTFT)频域的采样。在形式上，变换两端(时域和频域上)的序列是有限长的，而实际上这两组序列都应当被认为是离散周期信号的主值序列。即使对有限长的离散信号作DFT，也应当将其看作经过周期延拓成为周期信号再作变换。在实际应用中通常采用快速傅里叶变换以高效计算DFT。

2017-09-20

opencv-模板匹配

模板匹配是数字图像处理的重要组成部分之一。把不同传感器或同一传感器在不同时间、不同成像条件下对同一景物获取的两幅或多幅图像在空间上对准,或根据已知模式到另一幅图中寻找相应模式的处理方法就叫做模板匹配。

2017-09-20

opencv-分水岭算法

opencv的分水岭算法分水岭分割方法，是一种基于拓扑理论的数学形态学的分割方法，其基本思想是把图像看作是测地学上的拓扑地貌，图像中每一点像素的灰度值表示该点的海拔高度，每一个局部极小值及其影响区域称为集水盆，而集水盆的边界则形成分水岭。分水岭的概念和形成可以通过模拟浸入过程来说明。在每一个局部极小值表面，刺穿一个小孔，然后把整个模型慢慢浸入水中，随着浸入的加深，每一个局部极小值的影响域慢慢向外扩展，在两个集水盆汇合处构筑大坝，即形成分水岭。分水岭的计算过程是一个迭代标注过程。分水岭比较经典的计算方法是L. Vincent提出的。在该算法中，分水岭计算分两个步骤，一个是排序过程，一个是淹没过程。首先对每个像素的灰度级进行从低到高排序，然后在从低到高实现淹没过程中，对每一个局部极小值在h阶高度的影响域采用先进先出(FIFO)结构进行判断及标注。

2017-09-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人