本篇主要介绍如何通过中文维基百科语料库来训练一个word2vec模型。
一、语料库的下载
中文维基百科下载地址:https://dumps.wikimedia.org/zhwiki/
我下载是zhwiki-latest-pages-articles.xml.bz2 文件
文件名 | 内容 |
zhwiki-latest-pages-articles.xml.bz2 | 词条正文 |
zhwiki- |
本篇主要介绍如何通过中文维基百科语料库来训练一个word2vec模型。
中文维基百科下载地址:https://dumps.wikimedia.org/zhwiki/
我下载是zhwiki-latest-pages-articles.xml.bz2 文件
文件名 | 内容 |
zhwiki-latest-pages-articles.xml.bz2 | 词条正文 |
zhwiki- |