Keras之二分类问题
一、Keras开发概述
Keras模型主要包括以下几个部骤:
(1)定义训练数据:输入张量和目标张量。
(2)定义层的组成网络(即模型),将输入映射到目标。
(3)配置学习过程:选择损失函数、优化器和需要监控的指标。
(4)调用模型的fit方法在训练数据上进行迭代。
二、电影评论分类问题(二分类问题)
1.数据集:IMDB数据集(有关该数据集介绍请见这里)
2.独热编码(one-hot编码)有关该编码的介绍见REF1、REF2、REF3、REF4.
3.one-hot编码的目的见数据预处理之独热编码(One-Hot):为何要使用one-hot编码?
以下文字摘录自数据预处理之独热编码(One-Hot):为何要使用one-hot编码?:使用one-hot的直接缘由是如今多分类cnn网络的输出一般是softmax层,而它的输出是一个几率分布,从而要求输入的标签也以几率分布的形式出现,进而计算交叉熵之类。one-hot其实就是给出了真实样本的真实几率分布,其中一个样本数据几率为1,其余全为0.。计算损失交叉熵时,直接用1*log(1/几率),就直接算出了交叉熵,做为损失。
三、代码如下