自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(142)
  • 收藏
  • 关注

原创 时序动作定位:CVPR2018-Rethinking the Faster R-CNN Architecture for Temporal Action Localization

一、摘要:密歇根大学和谷歌的工作,提出一个把Faster-rcnn思想从目标检测领域迁移到时序动作定位任务的方法,之前有直接改Faster-rcnn的R-C3D,本文对faster-rcnn做了修改,使之更适用于时序动作定位任务,目前是Thumos14的最好效果,tIOU=0.5的时候达到了42.8%(直接从去年最佳的CBR提高了11.8个百分点,很强)。 TAL-net(本文): 时序动...

2018-07-22 15:37:25 7136 6

原创 深度学习参数设置-CNN

训练技巧:1.数据增强:翻转,随机尺寸变换,裁剪,位置偏移,颜色抖动。 优点:可以提高网络泛化能力。2.预处理:零均值化(中心化)和标准化(归一化):取消由于量纲不同、自身变异或者数值相差较大所引起的误差。 优点:标准化加速梯度下降速度(加速收敛)、有可能提高精度。 零均值化:相当于平移到中心(0,0),变量减去均值。 标准化:使得不同的特征具有相同的尺度(Scale)...

2018-07-19 21:55:10 8520

原创 Temporal Action Detection (时序动作检测)综述

最近几年由于网络上视频量的急剧增多和神经网络的飞快发展,这项任务得到了更多的关注。目前这项任务的主要数据集有THUMOS2014、ActivityNet。评价指标为IOU,目前2017的大多数工作在IOU=0.5的情况下达到了20%-30%的MAP,虽然较2016年提升了10%左右,但是在IOU=0.7时直接降低到了10%以下,2018年IOU=0.5有34%的MAP。目前的趋势是寻找视频内活...

2018-06-17 18:40:38 31210 20

原创 旋转矩阵、欧拉角、轴角、四元数

旋转矩阵、欧拉角、四元数【如果有错的地方记得提醒我,感谢】一、左右手坐标系主要各种相机传感器坐标方向其实都不太一致,左手坐标系旋转90度还是左手坐标系,这里分左右手【关注的是三个坐标轴组合方式】。可以对照以上两张图自己转一下,图一来自网络,图二来自《视觉slam十四讲》。二、旋转矩阵2.1 什么是旋转矩阵?旋转矩阵:在乘以一个向量的时候有改变向量的方向但不改变大小的效果并保持了手性的矩阵。刚体上的任意一个点P(x1, y1, z1)绕过原点的轴(i, j, k)旋转θ,旋转后的点为P’(

2021-02-16 16:08:57 1399

原创 pytorch数据类型及类型转换等

一、pytorch数据类型及类型转换0.pytoch中的数据类型Data typedtypeCPU tensorGPU tensor32-bit floating pointtorch.float32 or torch.floattorch.FloatTensortorch.cuda.FloatTensor64-bit floating pointtorch.float64 or torch.doubletorch.DoubleTensortorch.cud

2020-09-13 14:49:31 1263

原创 《AANet: Adaptive Aggregation Network for Efficient Stereo Matching》CVPR2020

AANet《AANet: Adaptive Aggregation Network for Efficient Stereo Matching》CVPR2020,针对双目匹配任务的论文。论文:https://arxiv.org/abs/2004.09548v1代码:https://github.com/haofeixu/aanet一、目的和贡献:目前最好的立体匹配模型基本都用3D卷积,计算复杂度高且占用大量存储空间,本论文的目的就是完全替代3D卷积;提出:尺度内代价聚合模块:基于稀疏点,缓解边

2020-06-25 08:42:27 2286

原创 《Dynamic Filter Networks》动态过滤网络

Dynamic Filter Networks《Dynamic Filter Networks》NIPS 2016论文链接:https://arxiv.org/abs/1605.09673一、目的卷积核参数训练完就是固定的,不够灵活,作者希望得到一个根据输入动态生成的过滤器。提出dynamic filter module(filter-generating network 、dynamic filtering layer).根据一个视角图预测其他视角(旋转人脸)、预测视频下一帧、2D变3D等等常

2020-06-05 00:49:54 3204

原创 《GA-Net: Guided Aggregation Net for End-to-end Stereo Matching》笔记

GA-Net《GA-Net: Guided Aggregation Net for End-to-end Stereo Matching》CVPR2019的一篇双目匹配论文,借鉴了一些传统方法SGM和滤波的思想,提出了两个网络层。论文:https://arxiv.org/pdf/1904.06587v1.pdf代码:https://github.com/feihuzhang/GANet一、摘要在双目匹配任务里,传统方法和深度学习方法里代价聚合都非常重要,可以获得更准确的视差。提出了两个新的网络层

2020-06-04 21:23:01 762

原创 非root权限安装gcc到自己路径

非root权限安装gcc到自己路径很多实验室服务器公用,gcc版本低导致有些依赖编译不通过,非root权限用户可以在自己目录安装需要的gcc,不会影响别人。1.下载从GCC网站里下载GCC传到服务器,右侧有个Mirror里面的比较快,如下载:gcc-9.3.0。2.解压解压后进入文件夹gcc-9.3.03.下载gcc依赖在gcc-9.3.0文件夹运行以下指令下载依赖包./contrib/download_prerequisites4.编译安装这里由于没有root权限,需要把 --pre

2020-05-26 15:44:13 2959 7

原创 SGM(Semi-Global Matching)算法笔记

SGM论文:《Stereo Processing by Semi-Global Matching and Mutual Information》半全局双目匹配算法:逐像素匹配;用互信息来做匹配代价;用多个一维平滑约束近似二维平滑约束进行“全局”优化。【全局匹配需要考虑所有像素,用一个全局能量函数;局部匹配需要针对局部区域做代价聚合;SGM不是只考虑像素局部区域,也没有考虑所有的像素,只考虑了非遮挡点。】逐像素匹配由平滑约束支持,该通常表示为全局代价函数。 SGM通过从各个方向的逐路径优化来快速近似

2020-05-11 16:25:56 3744 1

原创 机器学习常用评价指标、混淆矩阵、ROC曲线、AUC

机器学习常用评价指标、混淆矩阵、ROC曲线、AUC1.混淆矩阵1.1 什么是混淆矩阵?也叫误差矩阵,是表示精度评价的一种标准格式,可以用来评价监督算法性能。用n行n列的矩阵形式来表示,可以直观的看出模型对各个类别的分类性能,也可以利用它计算各个类别准确率,召回率。1.2 混淆矩阵里的内容是什么意思?以二分类为例:正例(Positives):希望识别出的类别。负例(Negaives):其他类别。TP:True Postive,真阳性,预测是正类,真值也是正类;FP:False Posit

2020-05-10 15:49:21 1110

原创 格路问题

格路问题1.格路问题:从(0,0)点出发只能沿x轴或y轴的正方向每步走一个单位,最终走到(m,n)点,有多少条路径?解法很简单,把寻找路径问题转化为求组合问题,一共要走m+n步,其中往x方向m步,y方向n步。列成式子为Cm+nnC_{m+n}^{n}Cm+nn​[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传2.不能接触对角线的格路问题假设m>n,(0,0)...

2020-04-29 23:32:46 2932

原创 计算组合数python实现

组合数1.阶乘的写法Cnm=AnmAmm=n!(n−m)!∗1m!C_n^m=\frac{A_n^m}{A_m^m}=\frac{n!}{(n-m)!}*\frac{1}{m!}Cnm​=Amm​Anm​​=(n−m)!n!​∗m!1​# import math# math.factorial() ,math里也自带了阶乘函数def factorial(n): res = 1 ...

2020-04-27 20:59:59 9610 1

原创 相机标定笔记和python实现

摄像机标定【相机模型】和【相机参数】相关内容看这里:https://blog.csdn.net/qq_33278461/article/details/1010262591.什么是相机标定:图像测量和机器视觉里,为了能确定现实世界的任意一个点到图像上对应像素点的投影位置,需要建立一个相机成像的几何模型。几何模型的参数就是相机参数,包括内参、外参和畸变参数。得到这个参数的过程就叫相机标定。...

2020-04-21 17:10:45 1795 3

原创 LeetCode 239. 滑动窗口最大值&二维滑动窗口

滑动窗口最大值####题目描述给定一个数组和滑动窗口的大小,找出所有滑动窗口里数值的最大值。例如,如果输入数组{2,3,4,2,6,2,5,1}及滑动窗口的大小3,那么一共存在6个滑动窗口,他们的最大值分别为{4,4,6,6,6,5}; 针对数组{2,3,4,2,6,2,5,1}的滑动窗口有以下6个: {[2,3,4],2,6,2,5,1}, {2,[3,4,2],6,2,5,1}, {2,3...

2020-04-21 02:06:15 2980

原创 错排问题

题目:某人写了n封信和n个信封,如果所有的信都装错了信封。求所有的信都装错信封共有多少种不同情况?本题属于错排问题,关键是找到递推关系:所有元素错排结果定义为D(n);(1)首先考虑第1个元素,它可以排的位置有 n-1 个,假设我们把它放到第 k 个位置;(2)然后考虑第k个元素,它可以和第1个元素互换,此时考虑其他元素的错排实际上就是D(n-2),完全与前两个无关,这种情况为(n-1)D...

2020-04-19 16:13:40 475

原创 轻量级网络:mobilnetv1,mobilnetv1,shufflenet v1,shufflenet v2笔记

轻量级网络本文大纲squeezenet: 还没写…mobilenet v1:《MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications》mobilenet v2:《MobileNetV2: Inverted Residuals and Linear Bottlenecks》mob...

2019-09-22 17:09:37 421

原创 相机参数和相机模型各个坐标系(世界坐标系、相机坐标系、图像坐标系、像素坐标系之间变换)

坐标系变换几个坐标系:世界坐标系(world coordinate system):用户定义的三维世界的坐标系,为了描述目标物在真实世界里的位置而被引入。单位为m。相机坐标系(camera coordinate system):在相机上建立的坐标系,为了从相机的角度描述物体位置而定义,作为沟通世界坐标系和图像/像素坐标系的中间一环。单位为m。图像坐标系(image coordinate...

2019-09-19 16:14:41 6679

原创 PCA和LDA简介

PCA:PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法,可用于提取数据的主要特征分量。目的:在高维数据中找方差最大的方向, 将n维特征映射到k维上(k < n),k维特征是全新的正交特征,也叫主成分。步骤:1)将原始数据按列组成n行m列矩阵X;2)将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值...

2019-09-17 13:04:21 955 1

原创 几个目标检测loss对比:faster rcnn、ssd、yolov1、yolov2、yolov3的loss

目标检测loss一、faster rcnn:分为RPN和Fast rcnn两个部分,每个部分再分为分类和回归损失:RPN损失:L({pi},{ti})=1Ncls∑iLcls(pi,pi∗)+λ1Nreg∑ipi∗Lreg(ti,ti∗)\begin{aligned} L\left(\left\{p_{i}\right\},\left\{t_{i}\right\}\right)=\fra...

2019-09-11 23:54:54 2645

原创 机器学习常用loss:L1 loss、L2 loss、smothL1 loss、huber loss

常用loss:L1:公式:L1=∑i=1n∣yi−f(xi)∣L1=\sum_{i=1}^{n}\left|y_{i}-f\left(x_{i}\right)\right|L1=i=1∑n​∣yi​−f(xi​)∣导数:dL1(x)dx={1 if x≥0−1 otherwise \frac{\mathrm{d} L_{1}(x)}{\mathrm{...

2019-09-11 23:33:56 11754

原创 python找到字符串里的中文?判断字符串是否包含中文?

正则匹配找到中文输出import restr1 = 'hello,你叫什么名字?My name is 李小龙.'res1 = re.findall("[\u4e00-\u9fa5]+",str1)print(res1)str2 = 'hello,你叫什么名字?My name is 李小龙.'a = re.compile("[\u4e00-\u9fa5]+")res2 = a.fin...

2019-09-04 13:05:37 3533

原创 高斯卷积核C++实现

高斯滤波器:高斯滤波器是一种线性滤波器,能够有效的抑制噪声,平滑图像。其作用原理和均值滤波器类似,都是取滤波器窗口内的像素的均值作为输出。窗口模板的系数和均值滤波器不同,均值滤波器的模板系数都是相同的为1;高斯滤波器的模板系数,则随着距离模板中心的增大而系数减小。所以,高斯滤波器相比于均值滤波器对图像个模糊程度较小。公式:一维高斯函数:G(x)=1σ2πe−(x−x0)2/2σ2G(...

2019-09-03 22:20:24 573

原创 拓扑排序C++实现

拓扑排序AOV(Activity On Vertex network)网:活动在顶点上的网,是一种顶点表示活动,边表示先后顺序的有向无环图,可以用来表示产品生产流等。拓扑排序:将有向无环图的所有顶点排列成一个序列,序列中的顶点满若一对顶点u和v存在路径u->v,则u一定出现再v之前。图解:略…有时间再补充吧步骤:1)从有向图里找一个没有前驱节点的顶点输出;2)删除1)中顶...

2019-08-29 11:57:34 762

原创 平衡二叉树和红黑树

平衡二叉树平衡二叉树(Balanced Binary Tree),具有以下性质:它是一棵空树或它的左右两个子树的高度差的绝对值不超过1,并且左右两个子树都是一棵平衡二叉树。红黑树红黑树的特性:(1)每个节点或者是黑色,或者是红色。(2)根节点是黑色。(3)每个叶子节点(NIL)是黑色。 [注意:这里叶子节点,是指为空(NIL或NULL)的叶子节点!](4)如果一个节点是红...

2019-08-28 18:12:49 371

原创 信息熵、相对熵、交叉熵

信息论的一个基本想法一个不太可能的事件居然发生了,要比一个非常可能的事件发生,能提供更多的信息。信息量所谓信息量是指从N个相等可能事件中选出一个事件所需要的信息度量或含量,也就是在辩识N个事件中特定的一个事件的过程中所需要提问"是或否"的最少次数. 所以***信息量是指信息多少的量度,用一个信息所需要的编码长度来定义。*** 根据信息论的基本想法,信息量和事件发生的概率有关。假设X...

2019-08-26 17:36:16 391

原创 c++ STL

c++ STL1.STLSTL主要包含容器,算法,迭代器容器:包含大多数数据结构,数组、链表、队列、堆、栈、树等。算法:包含增、删、改、查找、排序等迭代器:相当于指针,通过有序的移动把容器的元素和算法关联起来,是实现STL功能的基础。2.模版:提供一种通用的方法开发可重用代码,算是一种多态.是泛型编程的基础,泛型编程即以一种独立于任何特定类型的方式编写代码。模板是创建泛型类...

2019-08-24 23:24:07 118

原创 one class问题、few shot(one-shot)问题、异常检测问题

one class问题one class与2分类,多分类的区别?two class:"是"自行车,或者"不是"自行车,训练集里有自行车的数据和不是自行车的数据。模型判断是属于自行车类,还是others类。mutil class: 人脸识别等,每个人就是一个类别;COCO数据集包含80个class的数据;one class:"是"自行车,或者"不是"自行车,但是训练集里只给了自行车的数...

2019-08-07 21:18:29 1699

原创 深度学习中的label smoothing

label smoothing:交叉熵:H(p,q)=−∑i=1np(xi)log⁡(q(xi))H(p, q)=-\sum_{i=1}^{n} p\left(x_{i}\right) \log \left(q\left(x_{i}\right)\right)H(p,q)=−i=1∑n​p(xi​)log(q(xi​))其中p(xi)是真值, q(xi) 是预测值。交叉熵的问题:交叉...

2019-08-03 18:32:53 1332

原创 双目立体匹配原理及流程简介

立体视觉:立体视觉:立体视觉是计算机视觉领域的一个重要课题,它的目的在于重构场景的三维几何信息.其应用包括移动机器人的自主导航系统,航空及遥感测量,工业自动化系统等。双目立体视觉:双目立体视觉(Binocular Stereo Vision)是机器视觉的一种重要形式,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法...

2019-07-27 01:22:41 11190 2

原创 python类方法、静态方法、属性方法

类方法、静态方法、属性方法1.概念@classmethod, @staticmethod和@property这三个装饰器的使用对象是在类中定义的函数。@staticmethod装饰器可把其装饰的方法变为一个静态方法;不能访问实例变量和类变量的;可以通过类名来调用这个方法。@classmethod装饰器可把其装饰的方法变为一个类方法;类方法只能访问类变量(全局属性/静态字段),不能访...

2019-07-22 14:44:34 149

原创 python变量作用域、闭包、装饰器解析

变量作用域、闭包、装饰器一、变量作用域变量作用域:在Python程序中创建、改变、查找变量名时,都是在一个保存变量名的空间中进行,我们称之为命名空间,也被称之为作用域。python的作用域是静态的,在源代码中变量名被赋值的位置决定了该变量能被访问的范围。即Python变量的作用域由变量所在源代码中的位置决定。作用域的类型:在Python中,使用一个变量时并不严格要求需要预先声明它,但是...

2019-07-18 01:36:59 483

原创 opencv常用的绘图函数

opencv常用的绘图函数:cv2.line(), cv2.circle(), cv2.rectangle(),cv2.polylines(), cv2.putText()import numpy as np# 使用Numpy创建一张A4(2105×1487)纸img = np.zeros((640, 1280, 3), np.uint8)# 使用白色填充图片区域,默认为黑色im...

2019-07-12 16:41:41 285

原创 python常用编写格式和规范

0.目录格式列举了几种常用写法,深度学习各种模型常用3中方法,#1:VIS/|-- bin/| |-- vis||-- vis/| |-- tests/| | |-- __init__.py| | |-- test_main.py| || |-- __init__.py| |-- main.py||-- docs/| |-- ...

2019-06-06 17:24:15 10409

原创 VIM常见配置

VIM配置set nocp "工作在vi不兼容模式set ru "该命令打开 VIM 的状态栏标尺set hls "搜索时高亮显示被找到的文本set numbersyntax on "语法高亮filetype indent on "打开文件类型检查"tabset autoindent "按下回车键后,下一行的缩进会自动跟上一行的缩进保持一致set tabstop=4set ...

2019-05-28 01:01:09 630

原创 Python DeBug工具和静态语法检查工具

Python DeBug工具和静态语法检查工具:一、Debug工具PySnooper:一个极简DeBug工具平时python Debug大家一般都是print的方法来获取某个位置的输出或者某些变量的属性等。 而 PySnooper 让你能快速地获得这些信息,且相比之下它不需要细致地写 print 函数,只需要向感兴趣的函数增加一个装饰器就行了。我们会得到该函数的详细 log,包含哪...

2019-05-27 16:39:46 386

原创 Domain Adaptive在无监督语义分割上的应用

介绍几个域适应在分割上的比较好理解的应用:不了解Domain adaptive可以先看看简介:https://blog.csdn.net/qq_33278461/article/details/90480525以下几篇文章主要是用判别方法对域适应,有很多共性,主要讲一下第一篇,后面的作为对比参考,最后一篇ADDA是对利用判别方法作域适应的一个总结文章,它把这个过程抽象成了一个统一框架(推荐看一...

2019-05-23 15:03:13 1002

原创 Domain Adaptive简介

https://blog.csdn.net/wydbyxr/article/details/82906939https://blog.csdn.net/gzmfxy/article/details/78905042https://blog.csdn.net/ltochange/article/details/78773476https://zhuanlan.zhihu.com/p/21441...

2019-05-23 14:56:43 2718

原创 KMP算法

KMP算法KMP算法是一种改的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现,因此人们称它为克努特——莫里斯——普拉特操作(简称KMP算法)。KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是实现一个next()函数,函数本身包含了模式串的局部匹配信息。时间复杂度O(m+n)。问题:给一个目标串T:A...

2019-05-07 20:08:12 135

原创 LintCode Matrix Zigzag Traversal 矩阵的之字型遍历

Given a matrix of m x n elements (m rows, n columns), return all elements of the matrix in ZigZag-order.给你一个包含 m x n 个元素的矩阵 (m 行, n 列), 求该矩阵的之字型遍历。ExampleGiven a matrix:[[1, 2, 3, 4],[5, 6, 7, 8...

2019-04-24 17:29:13 195

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除