keras 实现IMDB电影评论情绪分类
数据集来自IMDB的2.5万部电影评论,以情绪(正面/负面)标记。评论已被预处理,并且每个评论被编码为一系列词索引(整数)。为了方便起见,词汇通过数据集中的整体频率进行索引,例如整数“3”对数据中第三个最频繁的词进行编码。这允许快速过滤操作,例如:“只考虑前10000个最常用的词,但是排除前20个最常见的词”。作为惯例,“0”不代表特定的单词,而是用于编码任何未知的单词。
IMDB数据集下载超时,详见本篇博客提供下载和使用:
https://blog.csdn.net/sinat_41144773/article/details/89843688
代码实现(评价指标+画损失图)
from __future__ import print_function
import numpy as np
np.random.seed(1337)
from keras.preprocessing import sequence
from keras.models import Sequential
from keras.layers import Dense,Embedding
from keras.layers import LSTM
fr