卷积运算
普通网友
这个作者很懒,什么都没留下…
展开
-
几何和线性代数算子
几何和线性代数算子Geometry and Linear Algebraic Operations了解了线性代数的基础知识,并了解了如何使用来表示转换数据的常见操作。线性代数是进行深度学习和更广泛的机器学习的主要数学支柱之一。虽然包含了足够多的机制来交流现代深度学习模型的机制,但是这个主题还有很多内容。将更深入地介绍线性代数运算的一些几何解释,并介绍一些基本概念,包括特征值和特征向量。Geometry of Vectors首先,需要讨论向量的两种常见的几何解释,即空间中的点或方向。基本上,向量是原创 2020-07-03 12:44:45 · 467 阅读 · 0 评论 -
矩阵分解
矩阵分解Matrix Factorization矩阵因子分解[Koren等人,2009]是推荐系统文献中一个成熟的算法。矩阵分解模型的第一个版本是由simonfunk在一篇著名的博客文章中提出的,在文章中描述了将交互矩阵分解的思想。后来由于2006年举行的Netflix竞赛而广为人知。当时,流媒体和视频租赁公司Netflix宣布举办一场竞赛,以提高推荐系统的性能。在Netflix基线(即Cinematch)基础上提高10%的最佳团队将获得100万美元奖金。正因如此,本次大赛引起了推荐系统研究领域的广泛关原创 2020-07-01 19:21:49 · 368 阅读 · 0 评论 -
基于区域的CNN(R-CNN)
基于区域的CNN(R-CNN)Region-based CNNs (R-CNNs)基于区域的卷积神经网络或具有CNN特征的区域(R-CNN)是一种将深度模型应用于目标检测的开创性方法。在本节中,将讨论R-CNN及其一系列改进:Fast R-CNN[Girshick,2015]、Faster R-CNN和MaskR-CNN。由于篇幅的限制,将把讨论局限于这些模型的设计上。R-CNNsR-CNN模型首先从一幅图像中选择几个建议的区域(例如,锚框是一种选择方法),然后标记类别和边界框(例如偏移量)。原创 2020-06-30 19:18:03 · 663 阅读 · 1 评论 -
Single Shot Multibox Detection (SSD)实战(下)
Single Shot Multibox Detection (SSD)实战(下)Training将逐步解释如何训练SSD模型进行目标检测。2.1. DataReading and Initialization创建的Pikachu数据集。batch_size = 32train_iter, _ = d2l.load_data_pikachu(batch_size)Pikachu数据集中有1个类别。在定义模块之后,我们需要初始化模型参数并定义优化算法。ctx, net = d2l.try原创 2020-06-30 16:08:04 · 3885 阅读 · 1 评论 -
Single Shot Multibox Detection (SSD)实战(上)
Single Shot Multibox Detection (SSD)实战(上)介绍了边界框、锚框、多尺度对象检测和数据集。现在,我们将利用这些背景知识构建一个目标检测模型:单次多盒检测(SSD)。这种快速简便的模式已经被广泛应用。该模型的一些设计思想和实现细节也适用于其他对象检测模型。Model图1显示了一个SSD模型的设计。该模型的主要组成部分是一个基本网络块和若干个串联的多尺度特征块。在这里,基网络块用于提取原始图像的特征,一般采用深度卷积神经网络的形式。关于SSDs的论文选择在分类层之前原创 2020-06-30 14:06:04 · 7235 阅读 · 1 评论 -
Anchor Boxes示例实战
Anchor Boxes示例实战目标检测算法通常对输入图像中的大量区域进行采样,判断这些区域是否包含感兴趣的目标,并调整这些区域的边缘,以便更准确地预测目标的真实边界框。不同的模型可能使用不同的区域采样方法。在这里,我们介绍一种这样的方法:它生成多个大小和纵横比不同的边框,同时以每个像素为中心。这些边界框称为锚框。我们将练习基于锚盒的对象检测。首先,导入此部分所需的包或模块。在这里,我们修改了NumPy的打印精度。因为打印张量实际上调用了NumPy的print函数,所以本节打印的张量中的浮点数更简洁。原创 2020-06-30 13:03:28 · 346 阅读 · 0 评论 -
全卷积网络Fully Convolutional Networks (FCN)实战
全卷积网络Fully Convolutional Networks (FCN)实战使用图像中的每个像素进行类别预测的语义分割。全卷积网络(FCN)使用卷积神经网络将图像像素转换为像素类别。与之前介绍的卷积神经网络不同,FCN通过转置卷积层将中间层特征映射的高度和宽度转换回输入图像的大小,使得预测结果在空间维度(高度和宽度)与输入图像一一对应。给定空间维度上的位置,信道维度的输出将是对应于该位置的像素的类别预测。将首先导入实验所需的包或模块,然后解释转置卷积层。%matplotlib inlinefr原创 2020-06-30 11:09:48 · 1643 阅读 · 0 评论 -
Fine-Tuning微调原理
Fine-Tuning微调原理如何在只有60000张图片的Fashion-MNIST训练数据集中训练模型。ImageNet,这是学术界使用最广泛的大型图像数据集,它拥有1000多万幅图像和1000多个类别的对象。然而,我们经常处理的数据集的大小通常比第一个大,但比第二个小。假设我们想在图像中识别不同种类的椅子,然后将购买链接推给用户。一种可行的方法是先找到一百张常见的椅子,每把椅子取一千张不同角度的图像,然后在采集到的图像数据集上训练分类模型。虽然这个数据集可能比时尚MNIST大,但是示例的数量仍然不到原创 2020-06-30 09:04:19 · 716 阅读 · 0 评论 -
转置卷积Transposed Convolution
转置卷积Transposed Convolution我们为卷积神经网络引入的层,包括卷积层和池层,通常会减小输入的宽度和高度,或者保持不变。然而,语义分割和生成对抗网络等应用程序需要预测每个像素的值,因此需要增加输入宽度和高度。转置卷积,也称为分步卷积或反卷积,就是为了达到这一目的。from mxnet import np, npx, initfrom mxnet.gluon import nnfrom d2l import mxnet as d2lnpx.set_np()Basic 2D T原创 2020-06-30 08:18:32 · 472 阅读 · 0 评论 -
激光雷达目标检测
激光雷达目标检测激光雷达,是以发射激光束探测目标的位置、速度等特征量的雷达系统。其工作原理是向目标发射探测信号(激光束),然后将接收到的从目标反射回来的信号(目标回波)与发射信号进行比较,作适当处理后,就可获得目标的有关信息,如目标距离、方位、高度、速度、姿态、甚至形状等参数,从而对飞机、导弹等目标进行探测、跟踪和识别。它由激光发射机、光学接收机、转台和信息处理系统等组成,激光器将电脉冲变成光脉...原创 2020-03-22 20:11:49 · 4054 阅读 · 0 评论 -
CVPR2020论文点评: AdderNet(加法网络)
CVPR2020论文点评: AdderNet(加法网络)论文原文链接:https://arxiv.org/pdf/1912.13200.pdf源码链接:https://github.com/huawei-noah/AdderNet简要与简单的加法运算相比,乘法运算具有更高的计算复杂度。深度神经网络中广泛使用的卷积正好是来度量输入特征和卷积滤波器之间的相似性,这涉及浮点值之间的大量乘法。现...原创 2020-03-17 15:16:06 · 1063 阅读 · 0 评论