- 博客(1)
- 收藏
- 关注
原创 维基百科简体中文语料训练word2vec词向量
维基百科简体中文语料训练word2vec词向量 步骤: 1.下载维基百科中文语料 2.使用工具从压缩包中抽取正文文本 3.将繁体字转简体字 4.分词 5.训练模型 6.测试模型 1.下载维基百科中文语料 语料下载地址:https://dumps.wikimedia.org/zhwiki/ 有不同时间段的下载地址,我们需要训练词向量,请选择包含articles.xml.bz2字段的链接(包含词...
2020-04-01 11:54:00 1801 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人