卷积神经网络实现THUCNews新闻文本分类(Pytorch实现)
代码结构整体代码结构如下图所示:点击run.py文件,直接运行。可以手动调节参数以及更换模型1数据集本文采用的数据集属于清华NLP组提供的THUCNews新闻文本分类数据集的一个子集(原始的数据集大约74万篇文档,训练起来需要花较长的时间)。数据集请自行到THUCTC:一个高效的中文文本分类工具包下载,请遵循数据提供方的开源协议。下载的数据放入THUCNews/data目录中。本次训练使用了其中的10个分类,每个分类6500条,总共65000条新闻数据。类别如下:体育, 财经, 房产, 家
原创
2021-02-07 22:30:52 ·
4425 阅读 ·
9 评论