二分类问题是应用广泛的机器学习问题,本例子将影评分为正面和负面
本例子运行结果:精度:[0.7237535303735733, 0.8508800268173218] --2019-10-15
下一步:尝试新的loss函数:MSE
尝试新的激活:tanh
#二分类问题是应用广泛的机器学习问题,本例子将影评分为正面和负面
from keras.datasets import imdb
(train_data,train_labels),(test_data,test_labels) = imdb.load_data(num_words = 10000)
#print(train_data[0])
print(train_labels.shape)
print(train_labels[0])
#把某条评论解码为英文单词
word_index = imdb.get_word_index() #word_index是一个单词映射整数的索引字典
#颠倒字典顺序,把整数映射为单词
reverse_word_index = dict([(value,key) for (key,value) in word_index.items()])
#索引前三位分别为padding(填充)、start of sequence(索引开始)、unknown(未知词)
decoded_review = ' '.join([reverse_word_index.get(i - 3, '?') for i in train_data[0]])
print(decoded_review)
##########
#将整数序列编码为二进制矩阵,one-hot(独热编码)
###########