深度学习: 视觉图像
目标检测、目标识别等视觉图像处理相关。
Doctor_Wu_
这个作者很懒,什么都没留下…
展开
-
图像预处理
1、C++实现图像的加载及其通道转换通道转换:从 HWC 转换到 CHW。// 传入一个图像容器中的所有图像,并将每一个图像的通道进行转换。std::vector<float> YOLOv4::prepareImage(std::vector<cv::Mat> &vec_img) { std::vector<float> result(BATCH_SIZE * IMAGE_WIDTH * IMAGE_HEIGHT * INPUT_CHANNEL);原创 2020-12-16 15:22:34 · 482 阅读 · 0 评论 -
anchor !!! 如何更好的理解 Faster RCNN 中的anchor ?
首先需要知道anchor的本质是什么,本质是SPP(spatial pyramid pooling)思想的逆向。而SPP本身是做什么的呢,就是将不同尺寸的输入resize成为相同尺寸的输出。所以SPP的逆向就是,将相同尺寸的输出,倒推得到不同尺寸的输入。接下来是anchor的窗口尺寸,这个不难理解,三个面积尺寸(1282,2562,512^2),然后在每个面积尺寸下,取三种不同的长宽比例(1:1...转载 2019-11-01 09:59:09 · 575 阅读 · 0 评论 -
softmax、cross entropy和softmax loss学习笔记
softmax接触到softmax网络,知道其是全连接层,但没有搞清楚它的实现方式,进他又接触到了softmax,果断仔细研究研究,有了softmax,损失函数自然不可少。先讲softmax。softmax是一个全连接层,功能是将卷积神经网络计算后的多个神经元输出,映射到(0,1)区间,给出每种分类的概率情况。下面主要记录全连接层到损失层是如何计算的。图的等号左边为全连接,w为权值,x是全...转载 2019-10-25 17:13:49 · 631 阅读 · 0 评论