nlp
天涯海阁未走远
这个作者很懒,什么都没留下…
展开
-
Embedding理解
突然想到了Embedding,好多细节记不清楚了。。找了点资料学习学习本文内容转自:https://kexue.fm/archives/4122里面对于词向量问题讲的十分清楚,对新手小白来说易懂。词向量,英文名叫Word Embedding,按照字面意思,应该是词嵌入。说到词向量,不少读者应该会立马想到Google出品的Word2Vec,大牌效应就是不一样。另外,用Keras之类的框架还有一个Em...转载 2018-06-19 14:30:49 · 3202 阅读 · 0 评论 -
merlin的安装(暂时未成功)
结合了两个内容。1:官网手册https://mtts.readthedocs.io/zh_CN/latest/merlin.html2:博客:https://www.cnblogs.com/zhanxiage1994/p/7797969.html其中官网的操作没有提及执行cd merlin/tools./compile_tools.sh的时候需要登录htk的网站注册。所以造...原创 2019-01-10 20:39:46 · 1518 阅读 · 0 评论 -
【转】 概率语言模型的分词方法
概率语言模型的分词方法《解密搜索引擎技术实战:Lucene & Java精华版(第2版)》第4章中文分词原理与实现,本章介绍了分词中的查找词典算法。查词典最早用首字母散列或者散列表实现,然后采用Trie树的方法开始流行,还有采用数组形式的双数组,后来又发展出和AC算法结合的Trie树。本节为大家介绍概率语言模型的分词方法。作者:罗刚来源:电子工业出版社|2013-12-12 22:...转载 2019-01-09 15:00:50 · 427 阅读 · 0 评论