- 博客(1)
- 收藏
- 关注
转载 维基百科简体中文语料的获取
转载自licstar的博客http://licstar.net/archives/262最近做实验需要较大规模的中文语料,很自然的就想到使用维基百科的中文数据。 使用维基百科做训练语料有很多好处:维基百科资源获取非常方便,有 Wiki Dump 可以直接下载,所有的最新备份都在里面。最近的一次备份是3月底,也就是5天前。相比之下,其他很多语料都需要用爬虫抓取,或者付费获得
2016-10-27 18:07:17 2928
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人