定义模型
一、激活函数 activation
model=models.Sequential()
model.add(layers.Dense(隐藏层个数,activation=‘’))
1、softmax
2、softplus
3、softsign
4、relu
5、tanh
6、sigmoid
7、hard_sigmoid
8、linear
编译模型必选两个参数:优化器 optimizers 和 损失函数(目标函数)loss
model.compile(optimizers='', loss='', metrics=[''])
二、优化器 optimizers
1、SGD:随机梯度下降法,支持动量参数,支持学习衰减率,支持Nesterov动量
2、RMSprop:除学习率可调整外,建议保持优化器的其他默认参数不变,该优化器通常是面对递归神经网络时的一个良好选择
3、Adagrad
4、Adadelta
5、Adam
三、目标函数、损失函数loss
1、mean_squared_error或mse
2、mean_absolute_error或mae
3、mean_absolute_percentage_error或mape
4、mean_squared_logarithmic_error或msle
5、squared_hinge
6、hinge
7、binary_crossentropy(亦称作对数损失,logloss)
8、
categorical_crossentropy:亦称作多类的对数损失,注意使用该目标函数时,需要将标签转化为形如(nb_samples, nb_classes)的二值序列
9、sparse_categorical_crossentrop:如上,但接受稀疏标签。注意,使用该函数时仍然需要你的标签与输出值的维度相同,你可能需要在标签数据上增加一个维度:np.expand_dims(y,-1)
10、kullback_leibler_divergence:从预测值概率分布Q到真值概率分布P的信息增益,用以度量两个分布的差异.
11、poisson:即(predictions - targets * log(predictions))的均值
12、cosine_proximity:即预测值与真实标签的余弦距离平均值的相反数