- 博客(7)
- 收藏
- 关注
原创 【深度学习实战】p6VGG-16实现人脸识别
VGG16(Visual Geometry Group 16)是一种深度卷积神经网络模型,由牛津大学的研究团队Visual Geometry Group开发。它是2014年的ImageNet图像识别挑战中的参赛模型之一,并在该挑战中取得了非常出色的结果。VGG16模型的设计思想是通过堆叠多个较小的卷积层和池化层来构建深层网络,以增强模型的表达能力。具体来说,VGG16模型由16个卷积层和3个全连接层组成。其中,卷积层主要用于提取输入图像的特征,而全连接层则用于将提取到的特征映射到类别概率上。
2024-05-24 20:29:13
888
原创 【深度学习实战】p4 猴痘病识别
具体而言,对于每个通道,BatchNorm2d计算该通道上所有样本的均值和方差,并使用这些统计量来对该通道上的特征进行规范化。这样可以保持不同样本之间的特征分布的一致性。是一种常用的技术,旨在解决深度神经网络训练中的梯度消失和梯度爆炸问题,并提高网络的收敛速度和稳定性。一直在思考这个问题,我们只设置了卷积核的size和channel,但是卷积核里面的具体值是多少是我们没有设置过的。我们都知道有不同的卷积核可以用来识别不同的特征,但是在cnn的过程中,这个卷积核的变化是我们看不到的。
2024-05-10 19:05:53
810
原创 【深度学习实战】p2 CIFAR10彩色图片识别
激活函数通常用来把卷积后提取到的特征进行激活,通常使用的激活函数有阶跃函数、Sigmoid、ReLU等等,函数类似于过滤器,在ReLU函数中,会将图像中小于0的置零,大于0的保留原值。learn_rate = 1e-1 变化学习率 epoches=50 batch_size=32。learn_rate = 1e-1 变化学习率 epoches=50 batch_size=64。learn_rate = 1e-1 变化学习率 epochs=30。learn_rate = 1 变化学习率 epochs=30。
2024-04-12 21:01:54
1082
1
原创 【深度学习实战】p1实现mnist手写数字识别
卷积神经网络仿造生物的视知觉(visual perception)机制构建,可以进行监督学习和非监督学习,其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化(grid-like topology)特征,例如像素和音频进行学习、有稳定的效果且对数据没有额外的特征工程(feature engineering)要求。通俗的讲,CNN是模拟人类对于物体识别的过程。在CNN中,卷积层用来进行特征的提取,激活函数来进行特征的激活,池化层来对结果进行降维、提取主要特征,减少计算量。
2024-04-01 20:32:17
281
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人