李兰溪的专栏

君子生非异也,善假于物也

让机器学会断句:基于词典的Bigram分词算法

目录概述从序列到图Unigram 模型Bigram 模型实现 概述 分词是NLP任务Pipeline中的重要步骤,一般来说都需要将句子切分成词之后,才能进一步把词进行向量化,最终输出各种各样的数学模型中,从而完成特定的NLP任务。中文不同于英文句子那样天然会用空格分割单词,所以中文句子切成独立...

2019-01-14 02:02:22

阅读数 336

评论数 0

让机器读懂文章: pLSA模型推导及实现

让机器读懂文章: pLSA模型推导及实现概述pLSA模型pLSA的EM算法推导总结参考文献 概述 人类读懂文章是一个很自然的行为,当我们读完一篇《背影》的时候,我们就可以知道这篇文章在写些什么,也就是我们说获得了这篇文章的相关知识。有了这些知识,我们就可以回答一些问题,例如: 问:这篇文...

2018-12-30 21:59:47

阅读数 20766

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭