【深度学习笔记】task3 神经网络八股

最新推荐文章于 2024-08-06 09:39:02 发布

一一张xi

最新推荐文章于 2024-08-06 09:39:02 发布

阅读量1k

点赞数

分类专栏：强化学习

本文链接：https://blog.csdn.net/a8689756/article/details/109250911

版权

深度学习

依依旧是跟着曹健老师的课程学习，终于来到精华部分了，之前又臭又长的代码们get out
https://www.bilibili.com/video/BV1B7411L7Qt?p=1
原码见 https://github.com/jlff/tf2_notes
目录
在这里插入图片描述

3.1搭建神经网络八股sequential

六步法

import相关模块，import
指定训练集测试集的输入和其对应特征，train,test
在Sequential()中搭建神经网络，逐层描述每层网络，相当于走一遍前向传播model=tf.keras.models.Sequential
在compile中配置训练方法，告知训练时使用哪种优化器，那个损失函数，选择哪种评价指标，model.compile
在fit中执行训练过程，告知训练集和测试集的输入标签和特征，告知每个batch是多少，告知要迭代多少此数据集，model.fit
用summary打印出网络结构和参数统计，model.summary
下面学习上述各种函数用法

3.1.1 Sequential

在Sequential中要描述从输入层到输出层每一层的网络结构，其语法格式为

model=tf.kears.models.Sequentiak([网络结构]) #描述各层网络

每一层的网络结构可以是

拉直层Flatten()：tf.keras.layers.Flatten()，这一层中不含计算，只是形状转换，把输入特征拉直变为一维数组
全连接层Dense():tf.kears.layers.Dense(神经元个数,activation='激活函数',kernel_regularizer=哪种正则化)
其中激活函数activation可以选择relu、softmax、sigmoid、ranh，正则化kernel_regularizer可选tf.keras.regularizer.l1()、tf.keras.regularizer.l2()
卷积层：tf.keras.layers.Conv2D(filers=卷积核个数,kernel_size=卷积核尺寸,strides=卷积步长,padding='valid'or 'same'
LSTM循环神经网络层tf.kears.layers.LSTM()

3.1.2 compile配置神经网络训练方法

model.compile(optimizer=优化器,loss=损失函数,metrics=['准确率']

建议入门时候先试用最左边优化器的名字

Optimizer优化器可选
- ‘sgd’ or tf.keras.optimizers.SGD(lr=学习率,momentum=动量参数)
- ‘adagrad’ or f.keras.optimizers.Adagrad (lr=学习率)
- ‘adadelta’ or tf.keras.optimizers.Adadelta (Ir=学习率)
- 'adam’or tf.keras.optimizers.Adam (Ir=学习率, beta_1=0.9,beta_2=0.999)
loss可选
- 'mse’or tf.keras.losses.MeanSquaredError()
- ‘sparse_categorical_crossentropy’ or tf,keras.losses.SparseCategoricalCrossentropy(from_logits=False)
Metrics可选（注意使用情况,y_为真实标签，y为输出结果）：
‘accuracy’：y_和y都是数值，与y_=[1],y=[1]
‘categorical_accuracy’:y_和y都是独热码（概率分布），如y_=[0,1,0] y=[0.256,-.695,0.048]
‘sparse_categorical_accuracy’:y_是数值,y是独热码(概率分布)，如y_[1] y=[0.256,-.695,0.048]

3.1.3 fit函数

fit函数用来执行训练过程
batch_size每次喂入神经网络的大小，epochs每次要迭代多少次数据集，validation_data和validation_split两者选其一即可

model.fit(训练集的输入特征，训练集的标签,batch_size=, epochs= ,validation_data=(测试集的输入特征,测试集的标签),validation_split=从训练集划分多少比例给测试集,validation_freq=多少次epoch测试一次)

3.1.4 summary

用于打印结果和参数统计
在这里插入图片描述

3.1.5 使用六步法复现鸢尾花数据集的训练过程

##1.import相关模块
import tensorflow as tf 
from tensorflow.keras.layers import Dense
from tensorflow.keras import Model 
from sklearn import datasets
import numpy as np 
import warnings
warnings.filterwarnings('ignore')

##2.指定训练集和测试集的输入极其对应标签
#对于本例从后面训练集中划分，所以这里没有再定义测试集
x_train=datasets.load_iris().data 
y_train=datasets.load_iris().target

#打乱数据
np.random.seed(116)
np.random.shuffle(x_train)
np.random.seed(116)
np.random.shuffle(y_train)
tf.random.set_seed(116)

##3.在Sequential中搭建网络结构
model=tf.keras.models.Sequential([
    #建立了一个全连接层，神经元个数为3,activation激活函数softmax,
    tf.keras.layers.Dense(3,
                          activation='softmax',
                          kernel_regularizer=tf.keras.regularizers.l2())
])

##4.compile配置神经网络训练方法，model.compile(optimizer=优化器,loss=损失函数,metrics=['准确率']
model.compile(optimizer=tf.keras.optimizers.SGD(lr=0.1),
              #由于神经网络末端选用了softmax函数，使得输出是概率分布而不是原始输出，所以from_logits是afalse
             loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
             metrics=['sparse_categorical_accuracy'])

##5.fit函数用来执行训练过程
model.fit(x_train, y_train, batch_size=32, epochs=500, validation_split=0.2, validation_freq=20)
#validation_freq每迭代多少次训练集要在测试集中验证一次准确率

##6.使用summary打印出网络结构和参数统计
model