自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 Ubuntu18.04下安装caffe

参考:https://blog.csdn.net/mu_yue_yue/article/details/88862077利用conda create -n caffe_gpu -c defaults python=3.6 caffe-gpu我导入caffe时出现:>>> import caffeTraceback (most recent call last): File "<stdin>", line 1, in <module> File "/h

2020-11-30 16:08:44 506

转载 论文中的AP指标

VOC 数据集评价指标是mAP = AP@0.5, 即 IOU=0.5 就算 True Positive;COCO数据集则会计算以下几个AP:AP(默认):IOU=0.5 到 IOU=0.95, 每隔0.05个IOU计算一次AP,然后求平均值AP (IOU=0.5), AP(IOU=0.75),两种典型IOU下的APAP(small),AP(medium),AP(large),即小中大三种不同尺度物体的AP值,其中small是指物体面积小于32 x 32, medium是指面积在32 x 32 -

2020-11-26 17:11:52 3639

转载 Vector 实现二维数组

参考博客:https://blog.csdn.net/a819825294/article/details/520887321. 这里简单叙述一下C++ 构建二维动态数组int **p;p = new int*[10]; //注意,int*[10]表示一个有10个元素的指针数组for (int i = 0; i < 10; ++i){ p[i] = new int[5];}2. 初始化方法1vector<vector<int>> vec;v

2020-11-24 21:01:25 10533 2

原创 torch.nn.BCELoss

import torchimport torch.nn as nna = torch.tensor([0.1,0.3,0.6])b = torch.tensor([0,0,1])loss = nn.BCELoss(reduction='sum')nn.BCELoss(a,b.float())得到输出结果为tensor(0.9729),其中BCELoss的计算过程为:首先这里的预测结果有3个,分别为(p1=0.1,p2=0.2,p3=0.6),对应的真实标签为(y1=0,y2=0,y3=1)

2020-11-24 20:18:14 699 2

原创 鱼眼图像(fisheye image)通过几何变换形成透视图(a perspective view)[存疑]

我看的论文是:Efficient Pedestrian Detection in Top-View Fisheye Images Using Compositions of Perspective View Patches我先把论文原文放上去:这里首先说的在相机坐标系(这儿我自己理解成相机坐标系)下是物体点入射光线和鱼眼图像上的投影点之间的对应关系:θ=θ0RR0\theta=\theta_{0} \frac{R}{R_{0}}θ=θ0​R0​R​这个可以参考我的另一篇博客中的内容然后

2020-11-13 16:27:07 1044

原创 中心透视投影和鱼眼投影的区别(Central perspective projection vs. fisheye projection)

前言panoramic images(全景图像)以及Fisheye图像都不满足中心透视投影(Central perspective projection),不能使用collinearity equation(共线性方程)中心透视投影其中中心透视投影数学模型建立的假设是:物体点入射线和光轴的夹角和在像平面上的成像点和光轴的夹角相同,如上图所示鱼眼透视投影鱼眼图像希望在有限的平面内获取更大的视角(几乎接近90度),然而按照中心透视投影的假设来说,在像平面上的像点会位于无穷远的地方,因此,我们需

2020-11-12 21:40:59 1450

原创 世界坐标系、相机坐标系、图像坐标系、像素坐标系都是什么?

四个坐标系都是什么?图像处理、立体视觉等等方向常常涉及到四个坐标系:世界坐标系、相机坐标系、图像坐标系、像素坐标系构建世界坐标系只是为了更好的描述相机的位置在哪里,在双目视觉中一般将世界坐标系原点定在左相机或者右相机或者二者X轴方向的中点。接下来的重点,就是关于这几个坐标系的转换。也就是说,一个现实中的物体是如何在图像中成像的。四个坐标系之间的相互转换从世界坐标系到相机坐标系 其中[x′,y′][x^{'},y^{'}][x′,y′]为世界坐标系下的坐标,将世界坐标系顺时针旋转θ\th

2020-11-12 15:19:08 2066

原创 FCOS:Fully Convolutional One-stage Object Detection论文阅读笔记

(一)Title FCOS论文阅读笔记(二)Summary本文提出一种fully convolutional one-stage object detector(FCOS),以每像素预测(per-pixel prediction)的方式解决目标检测,类似于语义分割。几乎所有的state-of-the-art object detectors,如RetinaNet、SSD、YOLOv3和Faster R-CNN,都依赖于pre-defined anchor boxes。相比之下,我们论文中提出的

2020-11-09 14:08:05 536

原创 CenterNet:Objects as Points论文阅读笔记

CenterNet论文阅读笔记(一)Title(二)Summary(三)Research Objective(四)Problem Statement(五)Method5.1 Loss Fuction5.2 网络架构和inference5.2.1 目标检测任务5.2.2 3D目标检测任务5.2.3 人体位姿估计(六)实现上的一些细节问题6.1 训练阶段6.2 Inference阶段(七)实验实验1实验2实验3实验4实验5实验5.1实验5.2实验5.3实验5.4实验5.5实验6实验7(八)Notes1. 本文中

2020-11-03 20:11:59 1024

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除