Keras loss调试记录

Clannad_niu

于 2019-10-15 17:20:13 发布

阅读量963

点赞数

分类专栏：机器学习文章标签：深度学习 loss

本文链接：https://blog.csdn.net/Clannad_niu/article/details/102570114

版权

最近尝试使用序列模型LSTM进行文本分类，数据集为入侵检测用的ADWA-LD数据集。

0x01 初始loss

最开始试运行模型时loss一直稳定为0.46，无论训练多少个epoch都不改变。下图为一开始使用的模型

def get_lstm_model(max_features, embed_size):
    model = Sequential()
    model.add(Embedding(max_features, embed_size))
    model.add(Bidirectional(LSTM(32, recurrent_dropout=0.1)))
    model.add(Dense(64)
    model.add(Dense(7))
    model.add(Activation('sigmond'))
    model.summary()

    adam = Adam(0.01)
    model.compile(optimizer=adam, loss='categorical_crossentropy', metrics=['accuracy'])

    return model

1.检查网络后发现最后的激活层存在问题，由于是多分类问题，因此需要采用softmax作为激活层。

2.全连接层要指定激活函数，确保梯度问题

0x02 第二次改进

改进后的模型如下，改进后模型的loss开始产生变化，但准确度在0.6左右

def get_lstm_model(max_features, embed_size):
    model = Sequential()
    model.add(E

最低0.47元/天解锁文章

Clannad_niu

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
Keras loss调试记录

最近尝试使用序列模型LSTM进行文本分类，数据集为入侵检测用的ADWA-LD数据集。0x01 初始loss最开始试运行模型时loss一直稳定为0.46，无论训练多少个epoch都不改变。下图为一开始使用的模型def get_lstm_model(max_features, embed_size): model = Sequential() model.add(Embe...
复制链接

扫一扫

专栏目录