DL之CNN:基于mnist手写数字识别数据集利用DeepConvNet(自定义的深度卷积神经网络【7+1】)模型训练、模型评估、模型预测(从99%→99.4%)

247 篇文章 236 订阅

DL之CNN:基于mnist手写数字识别数据集利用DeepConvNet(自定义的深度卷积神经网络【7+1】)模型训练、模型评估、模型预测(从99%→99.4%)

目录

利用自定义DeepConvNet【7+1】算法对mnist数据集训练实现手写数字识别并预测(超过99%)

输出结果

设计思路

核心代码

利用自定义DeepConvNet【7+1】算法对mnist数据集训练实现手写数字识别、模型评估(99.4%)

输出结果

设计思路

核心代码


利用自定义DeepConvNet【7+1】算法对mnist数据集训练实现手写数字识别并预测(超过99%)

输出结果

准确度都在99%以上

1、出错记录

col = np.zeros((N, C, filter_h, filter_w, out_h, out_w))
MemoryError

设计思路

1、网络结构

2、总体框架

核心代码

class DeepConvNet:

    def __init__(self, input_dim=(1, 28, 28),
                 conv_param_1 = {'filter_num':16, 'filter_size':3, 'pad':1, 'stride':1},
                 conv_param_2 = {'filter_num':16, 'filter_size':3, 'pad':1, 'stride':1},
                 conv_param_3 = {'filter_num':32, 'filter_size':3, 'pad':1, 'stride':1},
                 conv_param_4 = {'filter_num':32, 'filter_size':3, 'pad':2, 'stride':1},
                 conv_param_5 = {'filter_num':64, 'filter_size':3, 'pad':1, 'stride':1},
                 conv_param_6 = {'filter_num':64, 'filter_size':3, 'pad':1, 'stride':1},
                 hidden_size=50, output_size=10):
        # 初始化权重===========
            ……


    def predict(self, x, train_flg=False):
            ……


    def loss(self, x, t):    
            ……


        return acc / x.shape[0]

    def gradient(self, x, t):
        # forward
        self.loss(x, t)

        # backward
            ……


        return grads

    def save_params(self, file_name="params.pkl"):
            ……

    def load_params(self, file_name="params.pkl"):
            ……


        for i, layer_idx in enumerate((0, 2, 5, 7, 10, 12, 15, 18)):
            self.layers[layer_idx].W = self.params['W' + str(i+1)]
            self.layers[layer_idx].b = self.params['b' + str(i+1)]

利用自定义DeepConvNet【7+1】算法对mnist数据集训练实现手写数字识别、模型评估(99.4%)

输出结果

设计思路

核心代码

network = DeepConvNet()                         


network.load_params("data_input/DeepConvNet/deep_convnet_params.pkl")   

#T1、caluculate accuracy(float64)
print("DeepConvNet【7+1】 on mnist:caluculate accuracy (float64 type) ... ")
print(network.accuracy(x_test, t_test))          #caluculate accuracy(float64)


#T2、caluculate accuracy(float16)
x_test = x_test.astype(np.float16)        
for param in network.params.values():     
    param[...] = param.astype(np.float16)

print("DeepConvNet【7+1】 on mnist:caluculate accuracy (float16 type) ... ")
print(network.accuracy(x_test, t_test))  

  • 5
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
### 回答1: CNN卷积神经网络可以很好地实现MNIST手写数字识别数据集MNIST数据集是一个非常流行的手写数字识别数据集,包含60,000个训练样本和10,000个测试样本。CNN卷积神经网络可以通过卷积层、池化层和全连接层等结构,对图像进行特征提取和分类,从而实现对手写数字的识别。在实现过程中,需要对数据进行预处理、构建模型训练模型和评估模型等步骤。 ### 回答2: MNIST是机器学习领域中最基础的图像分类问题之一,目标是将手写数字识别成对应的数字。CNN卷积神经网络由于其较高的效果和较快的速度,被广泛应用于此类问题中。 首先,我们需要明确CNN卷积神经网络的基本结构。它由多个卷积层和池化层组成,其中卷积层用于提取图像中的特征,而池化层则用于降低数据维度,减少运算量。在最后一层全连接层,特征将被映射到数字1-10的输出,以进行分类。 对于MNIST手写数字数据集,我们需要对数据进行预处理和格式化,以适应卷积神经网络的输入。我们可以将每个图片的大小调整为28x28像素,并将其转换为黑白图像。由于图像中的每个像素都代表相应位置的亮度值,我们需要在神经网络中进行标准化和归一化。 接下来,我们可以使用Keras框架搭建一个简单的卷积神经网络。其中,我们可以通过添加卷积层和池化层来实现特征提取和减少数据维度。在第一个卷积层后,我们可以添加一个批标准化层,它可以使每个神经元的输出分布更加均衡,从而提高训练效果。在卷积神经网络的输出端,我们可以添加一个全连接层,用于进行分类。 在完成网络结构的搭建之后,我们需要对卷积神经网络进行训练。我们可以通过设置合适的损失函数和优化算法来实现。针对MNIST数据集,我们可以选择使用交叉熵作为损失函数,随机梯度下降作为优化算法。我们可以通过调整学习率、正则化等参数,来提高训练效果。 最后,我们可以将卷积神经网络应用到MNIST测试集中进行验证,并评估其识别准确率。通过逐步调整网络结构和参数,我们可以不断改进卷积神经网络的性能,并实现更准确的手写数字识别。 ### 回答3: MNIST手写数字识别是计算机视觉领域中一个经典的问题,它要求从图像中识别出手写的数字。而CNN卷积神经网络是目前最有效的解决方案之一。 CNN卷积神经网络是一种深度学习模型,通过输入层、卷积层、池化层和全连接层等模块组成。在MNIST手写数字识别中,图片输入层将长度为28*28的二维像素矩阵作为输入,经过卷积层、池化层、全连接层等几个步骤后输出对应的数字。 卷积层的作用是提取图像的特征,由于MNIST手写数字数据集的像素尺寸较小,因此用到的卷积核尺寸也较小。这里我们选取的卷积核为5*5,每个卷积核进行卷积时将每个像素与其周围的8个像素做卷积操作,这样可以从图像中提取更多的特征信息。 池化层的作用是减小图像的尺寸,在卷积层中提取的特征信息可能包含了相同重复或无用的信息,因此需要对其进行降维处理。在MNIST手写数字识别中,我们采取的是平均池化的方式,即将相邻的4个像素取平均值,将这个4*4的图像块变为一个单独的像素。 全连接层的作用是将提取出的特征信息映射到输出层,输出对应的数字。在MNIST手写数字识别中,我们选取两个全连接层,其中第一层的神经元数量为120,第二层的神经元数量为84。最后,输出层的神经元数为10,每个神经元对应一个数字。 在训练模型时,我们采用交叉熵损失函数和随机梯度下降法更新权重。具体来说,我们将训练集分成若干个批次(batch),每次训练只使用其中一个批次的数据并对网络进行反向传播更新权重。 实验结果表明,CNN卷积神经网络能够在MNIST手写数字识别数据集上达到98%以上的识别率,比传统的机器学习方法(如SVM等)具有更高的准确率。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一个处女座的程序猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值