基于Kears的Reuters新闻分类

最新推荐文章于 2024-07-25 15:01:40 发布

csdn0006

最新推荐文章于 2024-07-25 15:01:40 发布

阅读量5.2k

点赞数 1

分类专栏： DL 文章标签： keras 新闻分类深度学习

本文链接：https://blog.csdn.net/csdn0006/article/details/81051163

版权

本文介绍了如何使用Keras处理Reuters新闻数据集，进行多分类任务。通过建立神经网络模型，利用softmax激活函数和categorical_crossentropy损失函数进行训练，并探讨了模型优化和防止过拟合的方法。在实验中，模型在测试集上达到80%的准确率。

摘要由CSDN通过智能技术生成

Reuters数据集下载速度慢，可以在我的repo库中找到下载，下载后放到~/.keras/datasets/目录下，即可正常运行。

构建神经网络将路透社新闻分类，一共有46个类别。因为有多个类别，属于多分类问题，而每条数据只属于一个类别，所以是单标签多分类问题；如果每条数据可以被分到多个类别中，那问题则属于多标签多分类问题。
完整代码欢迎Fork、Star

路透社数据集

Reuters数据集发布在1986年，一系列短新闻及对应话题的数据集；是文本分类问题最常用的小数据集。和IMDB、MNIST数据集类似，Reuters数据集也可以通过Keras直接下载。

加载数据集

from keras.datasets import reuters

(train_data,train_labels), (test_data, test_labels) = reuters.load_data(num_words=10000)

有8982条训练集，2246条测试集。
每个样本表示成整数列表。

>>> train_data[10]
[1, 245, 273, 207, 156, 53, 74, 160, 26, 14, 46, 296, 26, 39, 74, 2979,
3554, 14, 46, 4689, 4329, 86, 61, 3499, 4795, 14, 61, 451, 4329, 17, 12]</

最低0.47元/天解锁文章

csdn0006

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录