- 博客(2)
- 收藏
- 关注
原创 中文分词多领域语料库
中文分词多领域语料库数据处理各位NLPer,大家好!如果你还在从事中文分词领域的相关研究,你一定会发现,随着时间推移,中文分词的研究越来越少,BERT出现后,以字为粒度的方法盛行,有关中文分词的论文已经很少出现在期刊、顶会之中。研究领域小众是常事,科研也从不应该盲目扎堆于热点技术之中,但是目前中文分词相关研究,已经许久没有新数据可用,旧数据也逐渐坏链,github频频登陆失败,更别提下载语料,这些都让神经网络相关研究无从下手。因此,我总结了目前公开的可用于分词的语料库,将其分享出来,以供各位学者参考
2022-02-18 18:24:14 1829 4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人