![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
mohhao
这个作者很懒,什么都没留下…
展开
-
大话Word2vec
文章目录Skip-gram和CBOW简单区别TF-idfSkip-gram和CBOW简单区别Skip-gram:词预测上下文CBOW:上下文预测词输入一个词,预测下一个词一个词预测多个词CBOW 多个词预测一个词3. 欧氏距离5. 余弦相似度TF-idf其中nd等于文档总数,df(t)为包含该词条的文档数例子:...原创 2020-03-30 01:09:41 · 151 阅读 · 0 评论 -
【读书笔记】Python Natural Language Processing by Jalaj Thanaki
Corpus analysisnltk包括四种形式的corporaIsolate corpus:文本和自然语言的集合,例如gutenberg、webtext等。Categorized corpus:这里的文本被打包分类成不同的类别,例如brown包含了news、hobbies、humor等类别。Overlapping corpus:这里的类别与类别之间会有重叠区域,例如retuers,比...原创 2019-03-13 22:43:18 · 173 阅读 · 0 评论