NLP
bhwang0755
这个作者很懒,什么都没留下…
展开
-
word2vec
word2vec1 (Mikolov et al., 2013a) toolkit can pre-train the character embeddings on the Chinese corpus. The obtained embeddings are used to initialize the character lookup table instead of rando转载 2017-02-23 12:03:52 · 242 阅读 · 0 评论 -
中文分词工具测评
2016-11-29 中文分词工具 测试数据集 1、SIGHAN Bakeoff 2005 MSR, 560KB http://sighan.cs.uchicago.edu/bakeoff2005/ 2、SIGHAN Bakeoff 2005 PKU, 510KB http://sighan.cs.uchicago.edu/bakeoff2005/ 3、人民日报 20转载 2017-02-23 17:52:06 · 1008 阅读 · 0 评论