新闻分类
1 对N个类别的数据点进行分类,网络的最后一层应该是大小为N的Dense层层
2 对于单标签多分类问题,网络的最后一层应该使用softmax激活,这样可以输出在N个输出类别上的概率分布
3 损失函数:分类交叉熵。将网络输出的概率分布与目标的真实分布之间的距离最小化
4 处理多分类问题的标签有两种方法:
通过分类编码(one-hot编码)对标签进行编码,然后使用categorical_crossentropy作为损失函数
将标签编码为整数,然后使用sparse_categorical_crossentropy作为损失函数
5 将数据划分到许多类别中,应该避免使用太小的中间层,以免在网络中造成信息瓶颈