keras新闻分类：多分类问题详解

置顶 zqx951102

已于 2022-03-30 20:06:35 修改

阅读量895

点赞数

分类专栏：深度学习 Python 文章标签：考研计算机研究生

于 2020-02-14 17:00:31 首次发布

本文链接：https://blog.csdn.net/zqx951102/article/details/104315240

版权

深度学习同时被 2 个专栏收录

129 篇文章 27 订阅

订阅专栏

Python

70 篇文章 13 订阅

订阅专栏

https://blog.csdn.net/einstellung/article/details/82695194
介绍详细
https://www.cnblogs.com/gezhuangzhuang/p/9823325.html
符合书上的例子代码
https://blog.csdn.net/yitian1585531/article/details/86558354
https://www.cnblogs.com/renyuzhuo/p/12222563.html
这两个参考

实际的背景是这样的：路透社将新闻分为了 46 个互斥的大类，一篇文章可能归属于其中的一类或多类，我们需要做的就是将新闻报道自动归类。问题不是与上一篇一样的非黑即白、非此即彼类型的判断了，而是考虑每篇文章是不同的各个分类的概率。稍加思考，我们就会发现这个问题虽然与上个问题有如上的不同，但是其相同部分其实更多，我们只需根据不同的特殊情况进行一定的更改就好了。具体的内容下面分别说明，相同部分简略说明，如有疑问请阅读上篇文章：

数据与前文一样，都可进行相同的初始化，即按照索引，将文章数据处理为单词索引的序列串，用 one-hot 方法处理向量使其可以为网络所处理。有区别的是这一次的结果，label 也需要处理，因为结果不是两个值，也是一个张量了。

仍然采用 relu 激活的中间层，投射的空间维度不能是 16 了，这里改成 64，原因是因为结果太多，用十六个维度去包含六十四个结果的信息，会在训练的过程中丢失过多的信息，导致准确率会有较大的下降，因此这里采用 64 层。

对于损失函数，上一篇的 binary_crossentropy 就不够用了，需要修改损失函数，sparse_categorical_crossentropy 适用于多分类情况的损失函数，前者与后者之间只是接口上的不同，需要注意一下。

我们仍旧训练 20 次，也出现了上次的问题，过拟合，只不过这一次是出现在第九次的迭代后，因此我们将迭代此处改为九，重新训练网络。图我放在了代码的前面，可以查看：

最后一层的网络，激活不应该用 sigmoid，而应该用 softmax，这样才能输出类别上的概率分布。这一点与二分类分布不一样。
最后启动训练网络，进行训练，大致可以达到 80% 的准确度。

到这里就结束了，但是还有两个问题值得关注一下。我们用随机分类器随机对文章进行分类，准确率是 19%，上一篇中的二分类的可以达到 50%。我们最后每条测试数据得到的结果是一个 46 维度的向量，是各个类别的概率值，其相加为 1（由于运算精度问题，最后其实是跟 1 有可能有一个很小的偏差），最大概率的类别就是我们的预测类别。相关代码已经在最后给出，可以参考查看。

zqx951102

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
keras新闻分类：多分类问题详解

https://blog.csdn.net/einstellung/article/details/82695194介绍详细https://www.cnblogs.com/gezhuangzhuang/p/9823325.html符合书上的例子代码https://blog.csdn.net/yitian1585531/article/details/86558354https://www...
复制链接

扫一扫