深度学习
来一瓶82年的拉菲就好
这个作者很懒,什么都没留下…
展开
-
【总结】特征金字塔
介绍在计算机视觉中,识别不同尺度的物体是一个基本的挑战。==基于图像金字塔的特征金字塔(简称为Featurized image pyramid,如下图)==是传统解决思路,具有一定意义的尺度不变性。尺度不变性指的是检测目标的尺度变换与金字塔中的不同层级相互抵消。直观地说,此属性使模型能够通过扫描模型的位置和金字塔不同层级来检测跨越大范围尺度的对象。...原创 2022-05-24 16:35:10 · 370 阅读 · 0 评论 -
AlexNet
AlexNet深度卷积神经网络的突破出现在2012年,突破可归因于两个关键因素:数据和硬件。下图是一个稍微精简版本的AlexNet,去除了当年需要两个小型GPU同时运算的设计特点。AlexNet和LeNet的设计理念非常相似,但也存在显著差异。 首先,AlexNet比相对较小的LeNet5要深得多。 AlexNet由八层组成:五个卷积层、两个全连接隐藏层和一个全连接输出层。 其次,AlexNet使用ReLU而不是sigmoid作为其激活函数。 AlexNet通过dropout控制全连接层的模型复杂度,而原创 2021-12-07 19:11:26 · 2216 阅读 · 0 评论 -
图像通道转换——从np.ndarray的[w, h, c]转为Tensor的[c, w, h]
在神经网络中,图像被转换为张量形式。pytorch中张量的通道顺序为[c, h, w]格式或者[n, c, h, w]格式如果需要将图像以np.ndarray形式输入需要知道np.ndarray默认将图像表示成[h, w, c]个格式,并且要对其进行转化。n:样本数量c:图像通道数w:图像宽度h:图像高度...原创 2021-12-03 15:34:35 · 1509 阅读 · 0 评论 -
Python:skimage、PIL、openCV读取的默认格式和通道顺序
(1)skimage.io.imreadH×W×C,RGB,数据类型 numpy.ndarray(2)PIL.Image.openH×W×C,RGB,数据类型 PIL.JpegImagePlugin.JpegImageFile通过 numpy.asarray(image_pil) 可转成 numpy.ndarray(3)cv2.imreadH×W×C,BGR,数据类型 numpy.ndarray通过 cv2.cvtColor(image_cv2, cv2.COLOR_BGR2RG原创 2021-12-03 15:22:00 · 3874 阅读 · 0 评论 -
LeNet
LeNet原创 2021-12-03 13:10:28 · 184 阅读 · 0 评论 -
卷积层池化层输出维度变化公式
(24条消息) 卷积层和池化层后输出大小方法_ddy_sweety的博客-CSDN博客_池化层输出大小原创 2021-12-03 11:06:06 · 420 阅读 · 0 评论