面向自然语言处理的深度学习
苏宇-算法交易
这个作者很懒,什么都没留下…
展开
-
第2章 词向量表示 GloVe word2vec skip-gram CBOW
第2章 词向量表示1 如何在模型中表示文本数据?1.1 独热编码(one-hot encoding)1.2 分布式表示(distributed representation)2 基于矩阵的分布表示2.1 GloVe模型2.1.1 论文2.1.2 简介2.1.3 文献综述2.1.4 GloVe模型参考资料1 如何在模型中表示文本数据?\quad众所周知,文本数据属于非结构化数据,那么如何在模型中恰当地对文本数据进行表示呢?\quad他山之石,可以攻玉~我们可以参考语音和图像领域的做法。在语音领域,研究人原创 2020-05-18 17:11:34 · 704 阅读 · 1 评论 -
第1章 自然语言处理和深度学习概述
第1章 自然语言处理和深度学习概述去除停用词,并分词计数向量化,生成词向量的one-hot编码TF-IDF分数正如章节题目,本章更多是一些基础性的概述,介绍的部分库的一些功能比较有趣。去除停用词,并分词from nltk.corpus import stopwordsfrom nltk.tokenize import word_tokenize# 需要先nltk.download('p...原创 2019-11-26 22:16:46 · 532 阅读 · 0 评论