本文总结了我在学习自然语言处理过程中遇到的比较优质的学习资料,会持续更新。
感谢原作者深入浅出的讲解和翻译人员(如果有的话)的奉献!
1、word embeddings(词嵌入/词向量)
深度学习模型计算的本质都是浮点数的乘法和加法运算,因此,任何语言的原生词汇都无法直接被模型利用,必须转化成数值。为了完成有意义的、准确的转化,word embedding
技术应运而生。
想要理解word embedding
的原理,推荐Jay Alammar的The Illustrated Word2vec。
大数据文摘对其做了翻译,文章名为:图解Word2vec,读这一篇就够了。