让我们首先了解一下 2018年机器之心关于中文词嵌入的一篇文章:
Chinese Word Vectors:目前最全的中文预训练词向量集合
讲述了北京师范大学中文信息处理研究所与中国人民大学 DBIIR 实验室的研究者开源了「中文词向量语料库」,目前,该研究的论文《Analogical Reasoning on Chinese Morphological and Semantic Relations》已经被 ACL2018 大会接收。
论文链接:https://www.aclweb.org/anthology/P18-2023/
项目链接:https://github.com/Embedding/Chinese-Word-Vectors
相关资料:
英文的词嵌入:GloVe: Global Vectors for Word Representation
本文https://blog.csdn.net/tmb8z9vdm66wh68vx1/article/details/93426915为你推荐中文自然语言处理数据集。