![](https://img-blog.csdnimg.cn/20190128202730216.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
自然语言处理
关于自然语言处理的一切
李兰溪
好奇并探索着
展开
-
让机器学会断句:基于词典的Bigram分词算法
目录概述从序列到图Unigram 模型Bigram 模型实现概述分词是NLP任务Pipeline中的重要步骤,一般来说都需要将句子切分成词之后,才能进一步把词进行向量化,最终输出各种各样的数学模型中,从而完成特定的NLP任务。中文不同于英文句子那样天然会用空格分割单词,所以中文句子切成独立的词相对困难,并且中文句子的词是上下文相关的,不同的分词方式会导致同一个句子出现不同含义。例如: 研究所取...原创 2019-01-14 02:02:22 · 3914 阅读 · 3 评论 -
让机器读懂文章: pLSA模型推导及实现
让机器读懂文章: pLSA模型推导及实现概述pLSA模型pLSA的EM算法推导总结参考文献概述人类读懂文章是一个很自然的行为,当我们读完一篇《背影》的时候,我们就可以知道这篇文章在写些什么,也就是我们说获得了这篇文章的相关知识。有了这些知识,我们就可以回答一些问题,例如:问:这篇文章写的主要内容是什么呢?答: 亲情、送别问:有类似《背影》这样的文章可以推荐的吗?答:龙应台-《送别》...原创 2018-12-30 21:59:47 · 37742 阅读 · 0 评论