![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
文章平均质量分 64
Xiaozhu_a
全力以赴, 你会很酷!
展开
-
Word2Vec模型增量训练
一、 问题由来word2vec的本质是一个神经网络语言模型,基于语言模型进行分布式词向量的训练。它需要大量的语料进行训练,从而找到词与词之间的关系,但是当我们已经训练好了一个word2vec模型之后,数据库中又新流动进来了很多语料,我们应该在怎么办呢?我们不可能又基于所有语料重新训练一遍(当语料过大时,太耗费时间了),这时候,增量训练就派上了用场。二、word2vec模型的增量训练impor...原创 2018-11-13 18:50:44 · 12974 阅读 · 12 评论 -
jiaba库之关键词提取(增量更新自定义语料)
一、提取语句关键词在自然语言处理中,经常会遇见对文章或者信件进行关键词提取。而jiaba库正给我们提供了两种简单的关键词提取方法(TF-idf与TextRank)。本文不讲这两方式提取关键词的原理,只注重如何实现。在Python中,短短四个语句就能实现关键词的提取,我们所使用的文本数据为《红楼梦》中的某个章节。第二回 贾夫人仙逝扬州城 冷子兴演说荣国府 诗云 一局输赢料不真,香销茶尽尚...原创 2018-11-14 22:33:54 · 5169 阅读 · 2 评论