贾小树-CSDN博客

原创针对pose变换坐标系

假设A坐标系和B坐标系都是三维坐标系，它们之间的旋转关系可以用一个旋转矩阵来表示。GPT的回答应该是对的：R_B = R_AB * R_A * R_AB^T，其中R_AB是A坐标系到B坐标系的变换。其中，R11、R12、R13、R21、R22、R23、R31、R32、R33是R_AB矩阵的元素。这样，我们就可以将A坐标系下的旋转矩阵R_A转换到B坐标系下的旋转矩阵R_B了。其中，^T表示矩阵的转置操作。

2023-12-19 19:41:18 86

原创相机内参模型Scaramuzza/ocam详解

鱼眼相机模型Scaramuzza

2022-07-02 00:28:21 4691 21

原创相机内参模型Mei/omni-directional详解

Mei相机模型

2022-06-22 19:49:14 4736 4

原创相机内参模型Kannala-Brandt/fisheye/pinhole+equi详解

fisheye详解

2022-06-22 11:23:38 4171

原创传感器标定

传感器标定

2022-06-22 00:13:38 174

原创 ubuntu18.04从源码编译安装OpenCV3.4

Ubuntu 源码安装opencv3

2022-06-21 22:25:09 839

原创 Ubuntu安装ros

Ubuntu安装ros

2022-06-21 22:01:22 292

原创 Ubuntu 18.04 升级 cmake 至最新版本

Ubuntu 18.04 通过命令： sudo apt-get install cmake只能安装低版本cmake，而有些库需要高版本才能进行编译。这里提供一个从源码安装最新版本的方法：查看当前版本：cmake --version安装依赖sudo apt install libssl-dev 下载源码：https://cmake.org/download/ 解压缩并进入文件夹：tar -xf cmake-3.22.4.tar.gzcd cmake-3.22.4 编译安装：

2022-05-19 15:21:01 3337

原创 opencv 求取Mat 最大值

（1）uint maxValue = *max_element(images[i].begin<uint16_t>(), images[i].end<uint16_t>());double maxValue = *max_element(img.begin<double>(), img.end<double>());参考：OpenCV求取最大最小值的两种方式

2022-03-28 20:25:12 4963

原创论文阅读：Optical Flow in the Dark

文章目录1. 论文总述1. 论文总述从论文题目中可以看出，本文主要是想改善暗光下的光流估计效果，先前的方法主要是将暗光下的image进行提亮，再估计光流，但作者认为这样效果不好，因为提亮时候会破坏帧与帧之间的运动信息。作者的方法是：合成数据，作者估计暗光下的噪声特性，然后将暗光特性加入到开源的光流数据集FlyingChairs，利用这样的合成数据集训练深度模型FlowNet 或者PWC-Net，然后在作者自己收集的raw格式的不同曝光的数据集上进行验证暗光下的效果，发现这样的合成数据集对预测暗光下的

2021-10-11 23:12:08 426

原创论文阅读：RAFT: Recurrent All-Pairs Field Transforms for Optical Flow

文章目录1. 论文总述2. RAFT结构被传统算法所启发3. RAFT的三个重大创新点4. 光流算法需要解决的难点5. 传统光流算法简介及缺点6. Fast DIS 有可能存在的问题7. 本文相近work8.1. 论文总述这篇也是基于CNN的光流估计work，ECCV2020的best paper。本文主要是在计算两帧图像特征的相似性时构建了一个4D的 correlation volumes，然后还参考了传统光流算法的迭代优化思想，逐步地一点一点的对flow map进行优化!! 实现上是用的循环单

2021-09-27 23:53:27 786 1

原创 Ubuntu 18.04 安装 PyCharm并创建快捷方式

1. Ubuntu 18.04 安装 PyCharm请参考博客：Ubuntu 18.04 安装 PyCharm（注：为Pycharm创建快捷方式或者添加到左侧收藏夹，不要参考这篇博客，比较麻烦）2. 创建快捷方式运行pycharm.sh后右击快速启动栏图标不能添加到收藏夹随便打开/新建一个项目，点击tools->create Desktop Entry关闭pycharm并重新运行pycharm.sh再次右击图标就可以添加到收藏夹...

2021-09-22 19:24:58 341

原创论文阅读：FlowNet 2.0: Evolution of Optical Flow Estimation with Deep Networks

文章目录1. 论文总述2. 利用CNN预测光流的另一种思路3. 通过堆叠网络来进行光流估计优化的idea来源4. FlyingThings3D (Things3D) dataset5. The order of presenting training data with different properties matters.6. 堆叠两个相同网络时（FlowNetS）7. 堆叠不同的网络结构（FlowNetC+FlowNetS,或者3/8 通道数的FlowNetS）8. FlowNet-CSS的训练好像

2021-09-20 13:00:46 860

原创论文阅读：FlowNet: Learning Optical Flow with Convolutional Networks

文章目录1. 论文总述2. FlowNetS结构的背后原因3. 相关层4. Variational refinement（变分优化）5. 数据集介绍6. 光流可视化7. 模型指标对比参考文献（重要！）1. 论文总述最近开始做基于深度学习的光流估计，本文的FlowNet应该是必须了解的，这是2015年的一篇文章，网络结构比较简单，就是基于类似语义分割的形式直接让网络输出dx dy；另外还有个大贡献，就是作者合成了一个经典的用来训练CNN的光流数据集: FlyingChairs，现在也仍然在用！！由于工

2021-09-17 23:11:10 431

原创 vscode通过ssh远程连接服务器

1.远程连接需求在服务器上训练、测试模型将自己的Linux系统的台式机当成一个服务器，这样自己远程办公时，可以通过ssh远程连接到自己的台式机在公司开会时，用笔记本远程连接自己的台式机，分享一些代码等但是直接在终端里，ssh连接服务器时，查看、编辑代码很不方便，需要vim，但由于自己vim不熟练，又不想学。。这时候就需要vscode提供的remote development插件了2.remote development插件的安装配置搜索remote development插件，并进行安装

2021-09-07 23:02:19 1152

原创论文阅读：Exposure Fusion

文章目录1. 论文总述2. Quality Measures3. 权重图和原图直接相乘融合的缺点4. 多分辨率融合效果好的背后原因5. 本文方法的不足之处参考文献1. 论文总述本文是2007年的一篇文章，也是图像融合中很经典的算法，对几张需要融合的图像，逐像素计算权重，然后根据权重进行逐像素融合；图像直接融合容易出现难看的比较假的缝隙边缘或者光晕等，于是作者将原图分解为拉普拉斯金字塔、将权重图分解为高斯金字塔，然后将这两个金字塔相乘，最后恢复出原图。优势：与HDR相比，不需要相机标定等参数，还跳过了t

2021-08-11 18:57:08 868

原创论文阅读：Fast Optical Flow using Dense Inverse Search

文章目录1、论文总述2. 光流鲁棒性遇到的挑战3. 保持精度的同时提高速度的一些方法4. Fast inverse search for correspondences5. Fast optical flow with multi-scale reasoning6. Fast Variational refinement7. 参数选择及3个结论8. 与其他方法对比及4个结论9. 本方法的不足之处10. 高帧率的影响参考文献1、论文总述最近开始接触光流方面的工作，在大概了解了LK光流法之后，我就开始看这

2021-08-11 12:32:08 2090

原创论文阅读：You Only Look One-level Feature（YOLOF）

文章目录1、论文总述2、FPN的两大作用3、MiMo和SiMo结构的不同4、一个有争议的点5、topK的取值6、训练时的Other Details参考文献1、论文总述本篇论文针对FPN的作用进行了深入分析，认为主要有两个功能：特征融合和对不同尺度目标进行分而治之优化，然后作者发现这两个作用中比较重要的是分而治之思想，并不是特征融合，这就让人保持怀疑了。作者分析完之后主要有两个工作：（1）去掉FPN，通过残差连接对两个不同感受野的feature map进行相加实现多种尺度感受野覆盖，详见论文中的fig

2021-04-02 17:44:44 332

原创论文阅读：Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty for Autono

文章目录1、论文总述2、NLL损失函数的优势3、不确定性的具体定义4、IOU与不确定性得分值的关系5、实验结果参考文献1、论文总述本篇论文主要是针对YOLO V3算法进行改进，提高TP的数量，降低FP的数量，改进点是针对原算法的bbox的坐标、高宽输出值是确定值，而用于分类的confidence、class score是概率值，所以作者利用高斯建模对Bbox的位置信息进行改进，通过输出每个值的均值和方差，相当于输出一种高斯分布，让它们也有一种不确定性，有一种得分的概念，这样bbox的得分不仅有类别得分，

2021-03-31 20:59:21 377

原创论文阅读：Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

文章目录1、论文总述2、Why does batch normalization work3、BN加到卷积层之后的原因4、加入BN之后，训练时数据分布的变化5、与BN配套的一些操作参考文献1、论文总述本篇论文提出了一个对CNN发展影响深远的操作：BN。BN是对CNN中间层feature map在激活函数前进行归一化操作，让他们的分布不至于那么散，这样的数据分布经过激活函数之后更加有效，不至于进入到Tanh和 Sigmoid的饱和区，至于RELU 激活函数也有一定的效果。论文的动机是为了改善CNN中的

2021-03-30 10:48:22 466

原创论文阅读：Non-local Neural Networks

文章目录1、论文总述1、论文总述本篇论文收到non-local mean opration传统算法的启发，希望在CNN中加入非局部的信息，而不仅仅是卷积核大小的局部信息，整篇论文看着有点蒙，有严格的理论支持，到最后实现的时候发现和self-attention机制比较像，作者说self-attention是Non-local的一种特殊形式。作者验证想法的实验主要用的是视频分类数据，因为非局部不仅仅是空间上的，也可以是时间上的，后续也有目标检测数据上的实验。详细解读可以参考这篇文章：【CV中的Atte

2021-03-25 21:47:46 110

原创论文阅读：Identity Mappings in Deep Residual Networks（ResNetV2）

文章目录1、论文总述2、f也是恒等映射后的变化3、跳连 Identity 的重要性4、激活函数不同位置的影响5、pre-activation的两点优势6、训练尺度用法参考文献1、论文总述本篇论文针对ResNet的中残差和恒等映射进行了进一步的分析，提出了一个改进版本ResNetV2，不过本人认为大多数情况下用原来的ResNet50或者ResNet101就已经够用，ResNetV2主要是针对CNN特别特别深时的改进，如大于100层，到1000层时，这时候再换ResNetV2即可。本文的工作主要是有两

2021-03-23 21:41:16 327

原创论文阅读：Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Dense Object Dete

文章目录1、论文总述1、论文总述本篇论文提出了泛化版的Focal loss（可以同时用于分类和回归分支），既将class 得分和 centerness得分的预测合并为了一个分支，解决了training和test时的gap，而且将边框回归的每个确定值的预测改为了16个离散值的预测，然后将其积分得到最终值。论文非常值得精度，里面值得学习的地方很多。原作者在知乎上对本篇论文解读的已经非常好了，可直接去看，本人就不赘述了。大白话 Generalized Focal Loss本文大概意思：背景框也会预

2021-03-22 23:28:36 1277

原创论文阅读：Network In Network

文章目录1、论文总述2、不加激活函数的CNN如何补偿非线性3、全局平均池化代替全连接层的优势4、dropout很重要5、Global Average Pooling比全连接好么6、feature map可视化参考文献1、论文总述笔者最近毕业论文写完处于一段空闲期，就想看几本书和以前落下的一些论文。本论文是2014年的一篇工作，好多年前了。。主要的创新是把多层感知机MLP加进了CNN中，用来提升CNN的非线性表达能力，作者认为没有激活函数的CNN是一个线性模型，特征表达能力不强，所以就想在每个featu

2021-03-18 22:27:43 166

原创论文阅读：Probabilistic Anchor Assignment with IoU Prediction for Object Detection（PAA）

文章目录1、论文总述2、 Anchor Assignment的研究进展和优缺点参考文献1、论文总述本篇论文主要是针对anchor的正负样本分配做改进，动机可以看下图：相比于其他工作，作者不仅在anchor assignment阶段提出了自适应分配正负样本的做法，而且在optimization阶段和后处理阶段也加入了想对应的改进，可谓很全面了。当然，最主要的工作还是利用高斯混合模型对anchor进行自适应的正负样本分配，抛弃了原先的基于IOU的分配方法，基于IOU的其实只看了anchor的定位信息，

2021-03-18 21:05:03 1226

原创论文阅读：FreeAnchor: Learning to Match Anchors for Visual Object Detection

文章目录1、论文总述2、手工设计的基于IOU的anchor分配的不合理3、anchor与GT匹配时的3个准则4、一种可以借鉴的性能对比方式1、论文总述本篇论文并不是anchor-free检测模型，是在RetinaNet的基础上进行改进，原先的正负样本分配都是根据手工设计的anchor与GT的IOU，作者认为这样不好，就想自适应的选择anchor作为正样本，具体做法：从IOU值较高的许多anchor中，让网络自己选择正样本（free anchor是这个意思），这块好像是用的最大似然估计做的，该过程从每个对

2021-03-17 20:46:32 227

原创论文阅读：Augmentation for small object detection

文章目录1、论文总述2、举例说明小目标的重要性3、COCO数据集中小目标的分布情况4、Augmentation与Oversampling结合时的3种策略5、复制-粘贴时的3种策略参考文献1、论文总述本篇论文主要针对COCO数据集上的小目标性能进行改进，相对来说，是比较实用的数据处理技巧，适用于所有的anchor-free和anchor-based的目标检测模型。（1）对含有小目标的图像进行过采样，一般过采样率取3时较好，这样大目标受到的影响不会太大，因为总的来说，类别不平衡、不同尺度间的目标数量不平衡

2021-03-16 21:03:37 518

原创论文阅读：Scale-Aware Trident Networks for Object Detection

文章目录1、论文总述2、与image pyramid、FPN相比3、Investigation of Receptive Field4、trident blocks加在哪里5、weight sharing的优势6、Scale-aware Training Scheme7、Fast Inference Approximation8、Ablation Studies9、 Comparison with State-of-the-Arts参考文献1、论文总述本文的动机主要是想改善目标检测中多尺度的问题（小目标

2021-01-13 17:24:39 369

原创论文阅读：Hierarchical multi-scale attention for semantic segmentation

文章目录1、论文总述2、论文先验3、取平均或者最大的缺点4、Relational context methods 对长方形物体有提升！5、Auto-labelling（hard lable）与 soft label6、注意力机制的具体实现过程7、Ablation study on Cityscapes8、 loss选择参考文献1、论文总述本篇论文总体来说有点水，文中首先提出一个如今语义分割任务中存在的一个问题：多尺度推理时，只是简单的取平均或者取最大，这样容易把最好的结果和最坏的结果结合在一起，导

2020-12-15 23:22:39 1415 2

原创论文阅读：ResNeSt: Split-Attention Networks

文章目录1、论文总述2、1乘1卷积相当于一种注意力机制3、ResNeSt网络结构4、SKNet网络结构5、ResNeSt的两种等价实现6、ResNeSt对resnet网络结构上的改动7、ResNeSt训练时候使用的tricks8、Ablation study9、ResNeSt与其他模型的效果对比10、附录中的彩蛋参考文献1、论文总述本篇论文在投稿阶段就在知乎上引发了广泛讨论，争议很多，这个争议我觉得不仅仅是ResNeSt特有的，而是现在的好多学术论文都有的问题，争议点就在于：文中提出的模型在数据集上提高

2020-10-08 15:59:53 1159

原创论文阅读：CSPNet: A NEW BACKBONE THAT CAN ENHANCE LEARNING CAPABILITY OF CNN

文章目录1、论文总述2、深度可分离卷积的局限性3、CSPNet用于目标检测时关注的3个问题4、CSPNet用在denseNet上时的对比示意5、Real-time object detector的现阶段发展情况6、Partial Transition Layer的几种形式及效果对比7、Apply CSPNet to Other Architectures8、Exact Fusion Model（EFM）的结构及其效果9、CSPNet在三种设备上的不同配置10、CSPNet在COCO数据集上与其他模型的对比1

2020-10-06 21:29:35 1961

原创论文阅读：EfficientDet: Scalable and Efficient Object Detection

文章目录1、论文总述2、各式各样的FPN及其效果3、BiFPN设计的心路历程4、Weighted Feature Fusion4、EfficientDets家族的网络结构图5、Compound Scaling针对目标检测的设置6、实验训练设置细节7、EfficientDet performance on COCO7、 EfficientNet和BiFPN的贡献各有多少8、EfficientDet performance on COCO参考文献1、论文总述本篇论文是Google提出的EfficientNe

2020-10-06 00:23:09 546

原创论文阅读：EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

文章目录1、论文总述2、compound scaling method方法的合理性3、给定计算资源后确定α, β, γ（即compound scaling method的流程）4、EfficientNet-B0的来源和主要组成部分5、EfficientNets指标6、EfficientNets激活可视化参考文献1、论文总述本篇论文的出发点是将分类模型的大小和效率放在一起考虑，希望增大模型的同时，效率也能比较高（推理速度比较快的意思），作者在论文中指出，以前的传统增大模型的方法主要是在单个维度上进行（例如

2020-10-05 23:26:01 447

原创算法题中的常用小程序记录（C++版）

1、得到一个数的逆序表示如：1234 输出为 4321int get_reverse(int num){ int res = 0; while (num!=0) { res = res*10+num%10; num = num/10; } return res; }2、判断一个数是否是回文int huiwen(int n){ int x=0; int s=n; while (s>0)

2020-08-15 17:37:58 198

原创论文阅读：AutoAssign

文章目录1、论文总述2、密集预测型FCOS正负样本分配的不足3、 Comparison of label assignment between different typical detectors.4、we transform the whole assignment step into two weight maps.5、公式6、Visualization of learned center weighting weights of different categories7、 Analysis of

2020-07-21 10:12:48 5134 5

原创 pytorch安装---快速版

1、用conda 创建一个Python虚拟环境2、进入这个虚拟环境3、去pytorch官网：https://pytorch.org/get-started/previous-versions/找到满足自己Python版本和cuda版本的安装命令如：conda install pytorch==1.2.0 torchvision==0.4.0 cudatoolkit=10.0 -c pytorch注：上面安装时会跳过pytorch 和 torchvision的安装，因为这俩包太大，国内环境受

2020-07-10 15:14:42 357

原创 pytorch教学：torch.nn.parallel.DistributedDataParallel（DDP分布式训练）

DDP训练大致是一个GPU开一个线程，如果有两个GPU，则将dataset分成2份，然后一个GPU读取一份下面的代码能正确使用DDP分布式训练，直接参考即可注：本代码只适用于单机多卡训练，多机多卡的由于资源有限还没试过在终端的运行命令：python -m torch.distributed.launch --nproc_per_node 2 train.py其中2表示你有几个GPUimport datetimeimport osimport torchfrom torch impor

2020-07-07 08:36:43 6565

原创论文阅读：MobileNetV2: Inverted Residuals and Linear Bottlenecks

文章目录1、论文总述2、普通卷积与深度可分离卷积的计算量对比3、移除部分非线性4、 The difference between residual block and inverted residual5、消融实验6、SSDlite1、论文总述这篇论文提出了一种适合移动端部署的分类网络：MobileNetV2，是在MobileNetV1的基础上改进得来，整体上还是采用MobileNetV1中的深度可分离卷积来降低网络的参数量和推理速度，从论文标题中就可以看出本篇论文的两个主要的改进点：Inverted

2020-07-04 17:38:32 369

原创论文阅读：DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution

文章目录1、论文总述2、RFP模块的具体实现3、SAC模块的具体实现4、 Ablation Studies1、论文总述本篇论文提出的目标检测模型DetectoRS在COCO数据集上的性能是当前最好（mAP：54.7），在实例分割和全景分割上效果也不错，主要是因为提出的改进方法是基于backbone和FPN的，适用于多种视觉任务，其他次优模型如：ResNeSt，CBnet也是基于backbone的改进，也许现在的趋势就是目标检测的网络结构大致已定（除anchor-free系列外），而且也有论文统计过，

2020-06-30 20:25:27 4571

原创论文阅读：Aggregated Residual Transformations for Deep Neural Networks（ResNeXt）

文章目录1、论文总述2、vgg/resnet 与 Inception系列网络设计机制的不同点3、ResNeXt并不是ensembling4、两个设计准则5、split-transform-merge的本质6、BN和Relu的位置1、论文总述这篇论文提出的网络是resnet的升级版，设计思想结合了vgg/resnet 的stacking building blocks 以及 Inception系列的 split - transform - merge，ResNeXt中的next是指作者在这篇论文中提出了另

2020-06-27 20:09:53 451

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

voc2coco_split.py

json2xml_jss.py

json_box_hw_vision.py

json2lableImg_jss.py

基于针孔模型的单目测距

空空如也