深度学习
依依旧是跟着曹健老师的课程学习,终于来到精华部分了,之前又臭又长的代码们get out
https://www.bilibili.com/video/BV1B7411L7Qt?p=1
原码见 https://github.com/jlff/tf2_notes
目录
3.1搭建神经网络八股sequential
六步法
- import相关模块,import
- 指定训练集测试集的输入和其对应特征,
train,test
- 在Sequential()中搭建神经网络,逐层描述每层网络,相当于走一遍前向传播
model=tf.keras.models.Sequential
- 在compile中配置训练方法,告知训练时使用哪种优化器,那个损失函数,选择哪种评价指标,
model.compile
- 在fit中执行训练过程,告知训练集和测试集的输入标签和特征,告知每个batch是多少,告知要迭代多少此数据集,
model.fit
- 用summary打印出网络结构和参数统计,
model.summary
下面学习上述各种函数用法
3.1.1 Sequential
在Sequential中要描述从输入层到输出层每一层的网络结构,其语法格式为
model=tf.kears.models.Sequentiak([网络结构]) #描述各层网络
每一层的网络结构可以是
- 拉直层Flatten():
tf.keras.layers.Flatten()
,这一层中不含计算,只是形状转换,把输入特征拉直变为一维数组 - 全连接层Dense():
tf.kears.layers.Dense(神经元个数,activation='激活函数',kernel_regularizer=哪种正则化)
其中激活函数activation可以选择relu、softmax、sigmoid、ranh,正则化kernel_regularizer可选tf.keras.regularizer.l1()、tf.keras.regularizer.l2() - 卷积层:
tf.keras.layers.Conv2D(filers=卷积核个数,kernel_size=卷积核尺寸,strides=卷积步长,padding='valid'or 'same'
- LSTM循环神经网络层
tf.kears.layers.LSTM()
3.1.2 compile配置神经网络训练方法
model.compile(optimizer=优化器,loss=损失函数,metrics=['准确率']
建议入门时候先试用最左边优化器的名字
- Optimizer优化器可选
- ‘sgd’ or tf.keras.optimizers.SGD(lr=学习率,momentum=动量参数)
- ‘adagrad’ or f.keras.optimizers.Adagrad (lr=学习率)
- ‘adadelta’ or tf.keras.optimizers.Adadelta (Ir=学习率)
- 'adam’or tf.keras.optimizers.Adam (Ir=学习率, beta_1=0.9,beta_2=0.999)
- loss可选
- 'mse’or tf.keras.losses.MeanSquaredError()
- ‘sparse_categorical_crossentropy’ or tf,keras.losses.SparseCategoricalCrossentropy(from_logits=False)
- Metrics可选(注意使用情况,y_为真实标签,y为输出结果):
‘accuracy’:y_和y都是数值,与y_=[1],y=[1]
‘categorical_accuracy’:y_和y都是独热码(概率分布),如y_=[0,1,0] y=[0.256,-.695,0.048]
‘sparse_categorical_accuracy’:y_是数值,y是独热码(概率分布),如y_[1] y=[0.256,-.695,0.048]
3.1.3 fit函数
fit函数用来执行训练过程
batch_size每次喂入神经网络的大小,epochs每次要迭代多少次数据集,validation_data和validation_split两者选其一即可
model.fit(训练集的输入特征,训练集的标签,batch_size=, epochs= ,validation_data=(测试集的输入特征,测试集的标签),validation_split=从训练集划分多少比例给测试集,validation_freq=多少次epoch测试一次)
3.1.4 summary
用于打印结果和参数统计
3.1.5 使用六步法复现鸢尾花数据集的训练过程
##1.import相关模块
import tensorflow as tf
from tensorflow.keras.layers import Dense
from tensorflow.keras import Model
from sklearn import datasets
import numpy as np
import warnings
warnings.filterwarnings('ignore')
##2.指定训练集和测试集的输入极其对应标签
#对于本例从后面训练集中划分,所以这里没有再定义测试集
x_train=datasets.load_iris().data
y_train=datasets.load_iris().target
#打乱数据
np.random.seed(116)
np.random.shuffle(x_train)
np.random.seed(116)
np.random.shuffle(y_train)
tf.random.set_seed(116)
##3.在Sequential中搭建网络结构
model=tf.keras.models.Sequential([
#建立了一个全连接层,神经元个数为3,activation激活函数softmax,
tf.keras.layers.Dense(3,
activation='softmax',
kernel_regularizer=tf.keras.regularizers.l2())
])
##4.compile配置神经网络训练方法,model.compile(optimizer=优化器,loss=损失函数,metrics=['准确率']
model.compile(optimizer=tf.keras.optimizers.SGD(lr=0.1),
#由于神经网络末端选用了softmax函数,使得输出是概率分布而不是原始输出,所以from_logits是afalse
loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
metrics=['sparse_categorical_accuracy'])
##5.fit函数用来执行训练过程
model.fit(x_train, y_train, batch_size=32, epochs=500, validation_split=0.2, validation_freq=20)
#validation_freq每迭代多少次训练集要在测试集中验证一次准确率
##6.使用summary打印出网络结构和参数统计
model