- 博客(1)
- 收藏
- 关注
原创 Spark MLlib — Word2Vec
Word2vec 是 Google 在 2013 年开源的一款将词表征为实数值向量的高效工具。能够将单词映射到K维向量空间,同时由于算法考虑了每个单词的上下文环境,因此词向量表示同时具有语义特性。本文对Word2Vec的算法原理以及其在spark MLlib中的实现进行了对应分析。1.背景知识1.1 词向量NLP中词向量通常有两种表示方式:One-hot Representaion 把每个单词按
2016-10-12 11:22:00 4828 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人