计算机视觉
space_dandy
算法
展开
-
Spiking Deep Convolutional Neural Networks for Energy-Efficient Object Recognition
论文地址:https://link.springer.com/article/10.1007/s11263-014-0788-31.摘要:卷积神经网络在解决目标检测等计算机视觉问题上展现了很大的优势,而脉冲神经网络在使用超低功耗的spike-based神经形态的硬件上具有极大的潜力。该篇文章的工作给出了一个新的将CNN转变为SNN网络的方法,并在DAPRA Neovision2和CIFAR-10数据集上达到了与传统CNN网络相当的优势。2.方法:2.1传统卷积神经网络模型由卷积层、tan原创 2020-11-11 14:39:26 · 1022 阅读 · 2 评论 -
R3Det: Refined Single-Stage Detector with Feature Refinement for Rotating Object
本文针对旋转目标的检测提出了R3det。论文地址:https://arxiv.org/abs/1908.056121.Introduciton 目前,旋转目标检测面临三个主要挑战:待检测目标纵横比较大 待检测目标的排列较为密集 类别不平衡 本文讨论了如何设计一个准确和快速的旋转目标检测器。文章提出了一个refined one-stage 旋转检测器,其设计策略结合了水平anchor的高召回率和旋转anchor对密集场景的适应性两方面的优点,在第一个阶段使用水平anch...原创 2020-10-14 15:03:21 · 10179 阅读 · 21 评论 -
Yolo算法详解
Yolo原理Yolo是一种目标检测算法,目标检测的任务是从图片中找出物体并给出其类别和位置,对于单张图片,输出为图片中包含的N个物体的每个物体的中心位置(x,y)、宽(w)、高(h)以及其类别。Yolo的预测基于整个图片,一次性输出所有检测到的目标信号,包括其类别和位置。Yolo首先将图片分割为sxs个相同大小的grid:Yolo只要求grid中识别的物体的中心必须在这个grid内。实现方法:让sxs个框每个都预测出B个boungding box,bounding box有5个量,分别为物体的x,y原创 2020-09-30 15:29:08 · 11899 阅读 · 0 评论 -
图像的一些扩增方法
制作数据集时,直接对原始文件夹中的图像扩增使用的方法,使用了PIL库中的Image函数from PIL import Image#读取图像im=Image.open('文件名')1.缩放im_resized=im.resize(32,32)2.旋转#逆时针90im_90=im.transpose(Image.ROTATE_90)#逆时针180im_180=im.transpose(Image.ROTATE_180)#逆时针270im_270=im.transpose(原创 2020-09-08 17:29:50 · 877 阅读 · 0 评论 -
Submanifold Sparse Convolutional Networks
学习文章Event-based Asynchronous Sparse Convolutional Networks涉及到本文的稀疏卷积操作。关注点目前卷积网络主要对密集输入进行处理,但是现实中有许多数据是稀疏的,作者提出了稀疏卷积操作用于处理系数点,该卷积可以在子流形结构上进行操作。1.Motivation1.1子流形膨胀如图所示,一维的源泉在二维平面上进行卷积操作时,发现随着卷积层数的增加,输出的特征图的稀疏性会迅速消失。子流形用于表示稀疏数据,因为它的有效维数低于它所在的空间,例如二维空原创 2020-08-27 16:23:20 · 1127 阅读 · 0 评论 -
Xception网络
参考:[1] https://blog.csdn.net/lk3030/article/details/84847879[2] https://zhuanlan.zhihu.com/p/127042277[3] https://www.cnblogs.com/ywheunji/p/10506747.html论文信息Xception:Deep Learning with Depthwise Separable Convolutions (https://arxiv.org/abs/1610.0235原创 2020-08-21 15:00:41 · 938 阅读 · 0 评论 -
目标检测算法概述
内容主要来自:(1)一文读懂目标检测https://zhuanlan.zhihu.com/p/40986674 (2)目标检测算法之SSDhttp://mp.weixin.qq.com/s?__biz=MzUyMjE2MTE0Mw==&mid=2247485558&idx=2&sn=d9b61680e523da49445f202f1fbb6954&chksm=f9d156eecea6dff8894f7ca6a1dd7a915c2...原创 2020-07-31 16:23:28 · 1616 阅读 · 0 评论 -
语义分割(FCN,UNET,DEEPLAB)
语义分割(FCN,UNET,DEEPLAB)语义分割的目的是对图像中的每一个像素点进行分类,从而确定每个像素点所属的类别。(从像素级别进行分类)1.FCN(Fully Convolustional Networks)VGG和Resnet等CNN网络通过在网络最后加入全连接层,然后再经过softmax获得类别的概率信息,得到的一维概率信息可以对整张图片的类别进行识别。FCN提出将网络后边的全连接层全部换成卷积,从而得到二维的特征图(feature map),使用反卷积层对特征图进行上采样,恢复到与图像相原创 2020-08-12 15:34:44 · 2489 阅读 · 0 评论