【深度学习笔记】task3 神经网络八股


依依旧是跟着曹健老师的课程学习,终于来到精华部分了,之前又臭又长的代码们get out
https://www.bilibili.com/video/BV1B7411L7Qt?p=1
原码见 https://github.com/jlff/tf2_notes
目录
在这里插入图片描述

3.1搭建神经网络八股sequential

六步法

  1. import相关模块,import
  2. 指定训练集测试集的输入和其对应特征,train,test
  3. 在Sequential()中搭建神经网络,逐层描述每层网络,相当于走一遍前向传播model=tf.keras.models.Sequential
  4. 在compile中配置训练方法,告知训练时使用哪种优化器,那个损失函数,选择哪种评价指标,model.compile
  5. 在fit中执行训练过程,告知训练集和测试集的输入标签和特征,告知每个batch是多少,告知要迭代多少此数据集,model.fit
  6. 用summary打印出网络结构和参数统计,model.summary
    下面学习上述各种函数用法

3.1.1 Sequential

在Sequential中要描述从输入层到输出层每一层的网络结构,其语法格式为

model=tf.kears.models.Sequentiak([网络结构]) #描述各层网络

每一层的网络结构可以是

  • 拉直层Flatten():tf.keras.layers.Flatten(),这一层中不含计算,只是形状转换,把输入特征拉直变为一维数组
  • 全连接层Dense():tf.kears.layers.Dense(神经元个数,activation='激活函数',kernel_regularizer=哪种正则化)
    其中激活函数activation可以选择relu、softmax、sigmoid、ranh,正则化kernel_regularizer可选tf.keras.regularizer.l1()、tf.keras.regularizer.l2()
  • 卷积层:tf.keras.layers.Conv2D(filers=卷积核个数,kernel_size=卷积核尺寸,strides=卷积步长,padding='valid'or 'same'
  • LSTM循环神经网络层tf.kears.layers.LSTM()

3.1.2 compile配置神经网络训练方法

model.compile(optimizer=优化器,loss=损失函数,metrics=['准确率']

建议入门时候先试用最左边优化器的名字

  • Optimizer优化器可选
    • ‘sgd’ or tf.keras.optimizers.SGD(lr=学习率,momentum=动量参数)
    • ‘adagrad’ or f.keras.optimizers.Adagrad (lr=学习率)
    • ‘adadelta’ or tf.keras.optimizers.Adadelta (Ir=学习率)
    • 'adam’or tf.keras.optimizers.Adam (Ir=学习率, beta_1=0.9,beta_2=0.999)
  • loss可选
    • 'mse’or tf.keras.losses.MeanSquaredError()
    • ‘sparse_categorical_crossentropy’ or tf,keras.losses.SparseCategoricalCrossentropy(from_logits=False)
  • Metrics可选(注意使用情况,y_为真实标签,y为输出结果):
    ‘accuracy’:y_和y都是数值,与y_=[1],y=[1]
    ‘categorical_accuracy’:y_和y都是独热码(概率分布),如y_=[0,1,0] y=[0.256,-.695,0.048]
    ‘sparse_categorical_accuracy’:y_是数值,y是独热码(概率分布),如y_[1] y=[0.256,-.695,0.048]

3.1.3 fit函数

fit函数用来执行训练过程
batch_size每次喂入神经网络的大小,epochs每次要迭代多少次数据集,validation_data和validation_split两者选其一即可

model.fit(训练集的输入特征,训练集的标签,batch_size=, epochs= ,validation_data=(测试集的输入特征,测试集的标签),validation_split=从训练集划分多少比例给测试集,validation_freq=多少次epoch测试一次)

3.1.4 summary

用于打印结果和参数统计
在这里插入图片描述

3.1.5 使用六步法复现鸢尾花数据集的训练过程

##1.import相关模块
import tensorflow as tf 
from tensorflow.keras.layers import Dense
from tensorflow.keras import Model 
from sklearn import datasets
import numpy as np 
import warnings
warnings.filterwarnings('ignore')

##2.指定训练集和测试集的输入极其对应标签
#对于本例从后面训练集中划分,所以这里没有再定义测试集
x_train=datasets.load_iris().data 
y_train=datasets.load_iris().target

#打乱数据
np.random.seed(116)
np.random.shuffle(x_train)
np.random.seed(116)
np.random.shuffle(y_train)
tf.random.set_seed(116)

##3.在Sequential中搭建网络结构
model=tf.keras.models.Sequential([
    #建立了一个全连接层,神经元个数为3,activation激活函数softmax,
    tf.keras.layers.Dense(3,
                          activation='softmax',
                          kernel_regularizer=tf.keras.regularizers.l2())
])

##4.compile配置神经网络训练方法,model.compile(optimizer=优化器,loss=损失函数,metrics=['准确率']
model.compile(optimizer=tf.keras.optimizers.SGD(lr=0.1),
              #由于神经网络末端选用了softmax函数,使得输出是概率分布而不是原始输出,所以from_logits是afalse
             loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
             metrics=['sparse_categorical_accuracy'])

##5.fit函数用来执行训练过程
model.fit(x_train, y_train, batch_size=32, epochs=500, validation_split=0.2, validation_freq=20)
#validation_freq每迭代多少次训练集要在测试集中验证一次准确率

##6.使用summary打印出网络结构和参数统计
model
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值