WillerW-CSDN博客

原创 sublime3 Package Control There are no package 的解决方法

在Preferences -> Package Settings -> Package Control -> Setting Users 中添加新的channel：“https://raw.githubusercontent.com/HBLong/channel_v3_daily/master/channel_v3.json”可以参考https://github.com/H...

2019-05-04 15:28:41 702

原创论文笔记：ROI-10D: Monocular Lifting of 2D Detection to 6D Pose and Metric Shape

1introduction这篇cvpr2019文章提出了一种度量精确的单目3D目标检测端对端方法。（arxiv:1812.02781）主要贡献有三点：一种度量精确的单目3D目标检测端对端方法，包括一种可微分的2D ROI到3D ROI 提升映射，并提供了用于回归3D box 实例的所有组件；一种用于在度量空间对其3D box的损失函数，直接优化其关于真值的误差；扩展模型，将其用于预测度...

2019-05-03 14:59:15 2354 1

原创论文笔记： Monocular Object Orientation Estimation using Riemannian Regression and Classification Network

这篇文章做的是从单目图像中使用CNN预测刚体目标的朝向。所谓朝向其实就是相机位姿中旋转部分，即目标在相机坐标系中旋转。之前也有过这种想法，将目标的检测中的anchor机制引入到旋转量的估计中。将2D旋转空间分为若干个关键位置，给定一张输入图片先预测最近的关键位置，再预测一个在该关键位置上的偏移量，得到最终的旋转量的估计。这样做的方法既可以避免了建立离散图像检索库造成的离散问题，也可以一定程度上解...

2019-05-02 15:18:55 426

原创论文笔记：Spherical Regression: Learning Viewpoints, Surface Normals and 3D Rotations on n-Spheres

文章目录摘要动机深度分类与回归网络训练分类回归结论球回归n球上受约束回归结论$S^1$，$S^2$, $S^3$上的特殊情况$S^1$：欧拉角估计$S^2$：表面法向量估计$S^3$：3D旋转估计实验结论摘要Many computer vision challenges require continuous outputs, but tend to be solved by discrete ...

2019-04-15 19:43:42 448

原创 caffe2 与 PyTorch 数据预处理

caffe2与PyTorch的图像预处理不同。caffe2中图像的通道与OpenCV相同，是BGR格式，标准化到0-255，PyTorch中图像是RGB格式，标准化到0-1。

2019-04-08 20:20:48 560

原创 pytorch 模型加载与保存

翻译自https://pytorch.org/tutorials/beginner/saving_loading_models.html保存和与加载模型，有三个核心函数需要熟悉：torch.save：保存一个序列化的对象至硬盘，。该函数使用了Python的pickle包用于序列化。模型、张亮和各种对象的字典都可以使用该函数保存；torch.load：使用pickle的反序列化功能将序列化...

2019-04-07 14:25:19 7279 3

原创论文笔记：Understanding the Limitations of CNN-based Absolute Camera Pose Regression

摘要Visual localization is the task of accurate camera pose estimation in a known scene. It is a key problem in computer vision and robotics, with applications including selfdriving cars, Structure-fro...

2019-04-02 10:47:43 1444

原创 Ubuntu pytorch 程序退出显存释放问题

Ubuntu pytorch 程序退出显存释放问题在多显卡情况下，pytorch程序在退出时显存可能会没有释放。可以通过在终端运行nvidia-smi查看显存的使用。解决方法为，在终端：fusr -v /dev/nvidia* 查看在gpu上运行的所有程序kill 所有连号的进程...

2019-03-12 08:46:26 2094 2

原创 maskrcnn benchmark　使用简介(1) DataLoader

1 配置文件“/maskrnn_benchmark/config”　文件夹下可以看到两个文件default.py和paths_catalog.py。default.py是默认的配置文件，paths_catalog.py保存了数据集和模型的保存地址，可以根据自己的情况进行修改。配置文件的一级选项有：INPUT：输入图像的尺寸、标准化均值和方差、RGB格式转化DATASETS: 训练和测试...

2019-03-10 10:58:41 1522

原创 keras batchnormalization 参数 update

在 tf 中需要一个占位符判断batchnormaliztion 层是否更新，在keras中并不需要。keras在训练过程中会自动地更新均值和方差，在测试过程中停止更新参数。https://stackoverflow.com/questions/50164572/batchnormalization-in-keras...

2019-01-21 20:39:07 2619 1

原创深度学习中的fan_in与fan_out

Understanding the difficulty of training deep feedforward neural network 中，fan_in指第i层神经元个数，fan_out指第i+1层神经元个数。通常卷积网络不是全连接的，fan_in与fan_out的计算方式有所不同。pytorch中:fanin=channelsin×kernerwidth×kernerheightf...

2019-01-21 20:38:49 8815

原创论文笔记：6-DoF Object Pose from Semantic Keypoints

ICRA上的一篇文章，提出了一种检测三维物体关键点检测以及6 DoF位姿估计的方法，可以用于instance- and category-based 的场景。首先采用Faster R-CNN检测得到目标的2D bb，然后在执行所提出的方法。所使用的网络结构是stacking hourglass，来源于human pose estimation，与cornetNet中的backbone有些类似。...

2018-12-30 21:17:12 1696

原创论文笔记：Discovery of Latent 3D Keypoints via End-to-end Ceometric Reasoning

这是在NeurIPS2018上的一篇文章，提出了一种检测RGB图像中3D关键点的category-specific方法。针对某一类别，所提出的网络可以学习得到一组最优的3D隐藏关键点，以及对应的检测器。通过学习得到隐藏关键点，可以克服手工标注关键点工作量大和难定义的问题(expensive and ill-defined)。网络的输入是同一物体的在不同视角下仿真得到的一对图像，以及目标的二值掩...

2018-12-30 20:02:16 1389

原创论文笔记：The Marginal Value of Adaptive Gradient Methods in Machine Learning

这篇文章质疑了adaptive优化算法的性能，比较了SGD、SGD with momentum与AdaGrad、RMSProp、Adam方法的泛化性能，并通过优化构建一个凸优化问题和四种深度网络验证了观点。主要结论有：SGD and SGD with momentum outperform adaptive methods on the development/test set.adapt...

2018-12-30 18:42:46 636

原创论文笔记： An Analysis of Scale Invariance in Object Detection – SNIP

有关目标检测器训练的两个问题作者提出了目标检测中有关训练的两个问题：对图像进行上采样以获得更好的性能是否有必要？当微调一个由分类任务预训练得到的网络时，训练图像的尺度是否应该限制在一个比较小的区间（64x64 到 256x256），还是所有尺寸的目标都参与到训练中。问题一在第一个问题上，作者在多尺度分类问题上进行了研究，得到了主要结论有：当训练图像与测试图像的分辨率相差越大时，性...

2018-12-30 18:42:33 294

原创论文阅读：CornerNet: Detecting Objects as Paired Keypoints

CornerNet简介很多目标检测会采用anchor来提升目标检测的定位精度，使用anchor主要有两个缺点：通常需要大量的anchor，但是只有少部分的anchors会与ground truth重叠，造成正负样本的不均衡，降低训练的效率；使用anchor需要一些超参数和设计方法，包括了anchor的数量、尺寸和比例等。需要通过对超参数调参完成anchor的设计，在多尺度框架下应对多分辨...

2018-12-30 18:42:08 243