python构建深度神经网络（DNN）续

最新推荐文章于 2024-04-16 21:43:02 发布

Ychan_cc

最新推荐文章于 2024-04-16 21:43:02 发布

阅读量3.8k

点赞数 1

分类专栏： python

本文链接：https://blog.csdn.net/Ychan_cc/article/details/67640185

版权

这篇博客在基础DNN教程之上，介绍了如何添加正则化项，展示中间损失函数的输出，构建交叉损失函数，并详细讲解了如何保存和应用训练好的模型进行新数据的测试。

摘要由CSDN通过智能技术生成

这篇文章在前一篇文章：python构建深度神经网络（DNN）的基础上，添加了一下几个内容：

1) 正则化项

2）调出中间损失函数的输出

3）构建了交叉损失函数

4）将训练好的网络进行保存，并调用用来测试新数据

1 数据预处理

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time    : 2017-03-12 15:11
# @Author  : CC
# @File    : net_load_data.py

from numpy import *
import numpy as np
import cPickle
def load_data():
    """载入解压后的数据，并读取"""
    with open('data/mnist_pkl/mnist.pkl','rb') as f:
        try:
            train_data,validation_data,test_data = cPickle.load(f)
            print " the file open sucessfully"
            # print train_data[0].shape  #(50000,784)
            # print train_data[1].shape   #(50000,)
            return (train_data,validation_data,test_data)
        except EOFError:
            print 'the file open error'
            return None

def data_transform():
    """将数据转化为计算格式"""
    t_d,va_d,te_d = load_data()
    # print t_d[0].shape  # (50000,784)
    # print te_d[0].shape  # (10000,784)
    # print va_d[0].shape  # (10000,784)
    # n1 = [np.reshape(x,784,1) for x in t_d[0]] # 将5万个数据分别逐个取出化成（784,1），逐个排列
    n = [np.reshape(x, (784, 1)) for x in t_d[0]]  # 将5万个数据分别逐个取出化成（784,1），逐个排列
    # print 'n1',n1[0].shape
    # print 'n',n[0].shape
    m = [vectors(y) for y in t_d[1]] # 将5万标签（50000,1）化为（10,50000）
    train_data = zip(n,m)  # 将数据与标签打包成元组形式
    n = [np.reshape(x, (784, 1)) for x in va_d[0]]  # 将5万个数据分别逐个取出化成（784,1），排列
    validation_data = zip(n,va_d[1])   # 没有将标签数据矢量化
    n = [np.reshape(x, (784, 1)) for x in te_d[0]]  # 将5万个数据分别逐个取出化成（784,1），排列
    test_data = zip(n, te_d[1])  # 没有将标签数据矢量化
    # print train_data[0][0].shape  #(784,）
    # print "len(train_data[0])",len(train_data[0]) #2
    # print "len(train_data[100])",len(train_data[100]) #2
    # print "len(train_data[0][0])", len(train_data[0][0]) #784
    # print "train_data[0][0].shape", train_data[0][0].shape #（784,1）
    # print "len(train_data)", len(train_data)  #50000
    # print train_data[0][1].shape  #(10,1)
    # print test_data[0][1] # 7
    return (tra