![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
自然语言处理
天涯海阁未走远
这个作者很懒,什么都没留下…
展开
-
Embedding理解
突然想到了Embedding,好多细节记不清楚了。。找了点资料学习学习本文内容转自:https://kexue.fm/archives/4122里面对于词向量问题讲的十分清楚,对新手小白来说易懂。词向量,英文名叫Word Embedding,按照字面意思,应该是词嵌入。说到词向量,不少读者应该会立马想到Google出品的Word2Vec,大牌效应就是不一样。另外,用Keras之类的框架还有一个Em...转载 2018-06-19 14:30:49 · 3201 阅读 · 0 评论 -
merlin的安装(暂时未成功)
结合了两个内容。 1:官网手册https://mtts.readthedocs.io/zh_CN/latest/merlin.html 2:博客:https://www.cnblogs.com/zhanxiage1994/p/7797969.html 其中官网的操作没有提及执行 cd merlin/tools ./compile_tools.sh 的时候需要登录htk的网站注册。所以造...原创 2019-01-10 20:39:46 · 1517 阅读 · 0 评论 -
【转】 概率语言模型的分词方法
概率语言模型的分词方法 《解密搜索引擎技术实战:Lucene & Java精华版(第2版)》第4章中文分词原理与实现,本章介绍了分词中的查找词典算法。查词典最早用首字母散列或者散列表实现,然后采用Trie树的方法开始流行,还有采用数组形式的双数组,后来又发展出和AC算法结合的Trie树。本节为大家介绍概率语言模型的分词方法。 作者:罗刚来源:电子工业出版社|2013-12-12 22:...转载 2019-01-09 15:00:50 · 426 阅读 · 0 评论