AG News-数据集

最新推荐文章于 2025-02-10 04:02:33 发布

不务正业的猿

最新推荐文章于 2025-02-10 04:02:33 发布

阅读量4k

点赞数

分类专栏：数据集下载文章标签：新闻语料库数据集 News 下载

本文链接：https://blog.csdn.net/ispeasant/article/details/108141995

版权

下载同时被 2 个专栏收录

198 篇文章 ¥29.90 ¥99.00

订阅专栏

数据集

169 篇文章

订阅专栏

496,835 条来自 AG 新闻语料库 4 大类别超过 2000 个新闻源的新闻文章，数据集仅仅援用了标题和描述字段。每个类别分别拥有 30,000 个训练样本及 1900 个测试样本。

This article offers an empirical exploration on the use of character-level convolutional networks (ConvNets) for text classification. We constructed several large-scale datasets to show that character-level convolutional networks could achieve state-of-the-art or competitive results. Comparisons are offered against traditional models such as bag of words, n-grams and their TFIDF variants, and deep learning models such as word-based ConvNets and recurrent neural networks.

译：

本文对字符级卷积网络（ConvNets）在文本分类中的应用进行了实证研究。我们构建了几个大规模的数据集，以证明字符级卷积网络可以达到最先进或最具竞争力的结果。比较了传统模型，如单词包、n-grams及其TFIDF变体，以及基于单词的ConvNets和递归神经网络等深度学习模型。

大

了解本专栏