初学
文章平均质量分 57
wenny喵
这个作者很懒,什么都没留下…
展开
-
neural-networks-and-deep-learning python2-->python3
在学习neural-networks-and-deep-learning 这本书的时候下载了代码,代码运行过程中由于python的版本(我的是3.5),出现了许多错误。1、TypeError: object of type 'zip' has no len()、'zip' object is not subscriptable对应的错误部分为:解决方案:将所有用到zip原创 2018-01-24 09:22:17 · 468 阅读 · 0 评论 -
LSTM Recurrent Neural Networks for Short Text and Sentiment Classication文章阅读笔记
一、文本预处理1、删除所有符号,例如:%2、所有数字用例如'SPEC——NUM'来代替3、为数据集创建词典二、词向量化采用one-hot来表示单词三、词典大小不需太大,原文中的词典大小是9000四、数据集样本数不平衡原文中Bad和Neutal类的样本数远远少于Good分类,因此将Bad和Neutral的样本数扩大了一倍四、LSTM、BLSTM、GRU对比 it has been shown in ...原创 2018-03-11 11:32:38 · 398 阅读 · 0 评论 -
《Sequential Short-Text Classification with Neural Networks》读书笔记
一、在Forward Sequential Short-Text Classification这章中主要介绍了一种通过利用文本序列信息来进行分类的方法步骤:1、短文本向量化:(1)利用word2vec向量化短文本(2)利用RNN或者CNN二次向量化文本2、训练分类器利用普通的FNN即可,X为一个长度为l的短文本序列假设第一层输入是:s[i-d1-d2:i],输出是Y[i-d2:i]其中输出Yj表示...原创 2018-03-12 15:20:51 · 755 阅读 · 0 评论 -
《From word embedding to document Distance》
该篇论文提出了一种新的计算句子相似度的方法wordmover distance,以及提升这种方法的计算效率的两种方法:word centroiddistance和Relaxed word moving distance。一、word moverdistance (1)单词向量化表示方式使用word2vec的向量化矩阵X∈Rdxn来表示有n个单词的词汇表,第i列表示在d维空间中第i个单词的向量。(2...原创 2018-04-01 15:22:23 · 1972 阅读 · 0 评论