Reuters-21578 数据集处理

最新推荐文章于 2022-09-27 15:10:35 发布

白又白胖又胖

最新推荐文章于 2022-09-27 15:10:35 发布

阅读量4.4k

点赞数 4

分类专栏：技术-其他

本文链接：https://blog.csdn.net/u010138055/article/details/72655027

版权

具体处理方法如下：

处理后的语料下载地址

点击打开链接

from time import strptime
import csv
import numpy

article_components = ['DATE', 'PLACES', 'DATELINE', 'TOPICS', 'PEOPLE', 'ORGS', 'EXCHANGES',
'COMPANIES', 'TITLE', 'BODY','HOUR']

files = ['reut2-000.sgm', 'reut2-001.sgm', 'reut2-002.sgm', 'reut2-003.sgm',
'reut2-004.sgm', 'reut2-005.sgm', 'reut2-006.sgm', 'reut2-007.sgm', 'reut2-008.sgm',
'reut2-009.sgm', 'reut2-010.sgm', 'reut2-011.sgm', 'reut2-012.sgm', 'reut2-013.sgm',
'reut2-014.sgm', 'reut2-015.sgm', 'reut2-016.sgm', 'reut2-017.sgm', 'reut2-018.sgm',
'reut2-019.sgm', &#

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

白又白胖又胖

关注关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
3
评论
Reuters-21578 数据集处理

具体处理方法如下：处理后的语料下载地址点击打开链接from time import strptimeimport csvimport numpyarticle_components = ['DATE', 'PLACES', 'DATELINE', 'TOPICS', 'PEOPLE', 'ORGS', 'EXCHANGES','COMPANIES', 'TITLE', '
复制链接

扫一扫