- 博客(22)
- 收藏
- 关注
原创 深度学习笔记——基于双向RNN(LSTM、GRU)和Attention Model的句子对匹配方法
本文主要是结合RNN和Attention Model做一些关于句子对匹配的模型总结。
2017-08-06 23:06:07 35905 4
原创 深度学习笔记——Attention Model(注意力模型)学习总结
Attention Model(注意力模型)学习总结,包括soft Attention Model,Global Attention Model和Local Attention Model,静态AM,强制前向AM的一些介绍,以及AM具体实现公式的几个变体及介绍,最后附上了自己用keras实现的一个静态AM的代码。
2017-08-06 21:49:46 153532 15
原创 自动编码器AutoEncoder学习总结
自编码器AutoEncoder学习总结,整理AutoEncoder的原理,AutoEncoder在分类任务上的使用,稀疏AE,以及对AE改进得到文档或句子向量表达的一篇paper(KATE: K-Competitive Autoencoder for Text)(KDD2017)
2017-07-23 21:01:16 15400 1
原创 关键词提取方法学习总结(TF-IDF、Topic-model、RAKE)
关键词提取方法学习总结(TF-IDF、Topic-model、RAKE)
2017-07-23 16:07:02 37771 2
原创 文本相似度计算的几个距离公式(欧氏距离、余弦相似度、Jaccard距离、编辑距离)
本文主要讲一下文本相似度计算的几个距离公式,主要包括:欧氏距离、余弦相似度、Jaccard距离、编辑距离。距离计算在文本很多场景下都可以用到,比如:聚类、K近邻、机器学习中的特征、文本相似度等等。
2017-06-08 21:57:14 44865 1
原创 深度学习笔记——TensorFlow学习笔记(三)使用TensorFlow实现的神经网络进行MNIST手写体数字识别
本文是TensorFlow学习的第三部分,参考的是《TensorFlow实战Google深度学习框架》一书,这部分讲述的是使用TensorFlow实现的神经网络进行MNIST手写体数字识别一个实例。这个实例将第二部分讲述的激活函数、损失函数、优化算法、正则化等都运用上了。同时,使用TensorFlow中利用变量名称来创建/获取变量的机制将前向传播的过程抽象出来,使得训练和测试时不需要关心神经网络的结构或是参数;还使用了TensorFlow保存模型的方法将模型持久化(保存),以及加载模型进行预测。
2017-06-04 00:20:59 6903 3
原创 深度学习笔记——TensorFlow学习笔记(二)激活函数、损失函数、优化算法和正则项
本文是TensorFlow学习的第二部分,主要学习的是激活函数、损失函数、优化方法和正则项,以及在TensorFlow中的实现。
2017-06-03 22:40:54 2827 1
原创 深度学习笔记——TensorFlow学习笔记(一)入门
本文只是在学习TensorFlow前期的一些入门知识总结,并结合一个用TensorFlow实现神经网络的例子来进一步加深对TensorFlow的理解。
2017-06-02 22:54:11 5712 3
原创 深度学习笔记——基于传统机器学习算法(LR、SVM、GBDT、RandomForest)的句子对匹配方法
句子对匹配(Sentence Pair Matching)问题是NLP中非常常见的一类问题,所谓“句子对匹配”,就是说给定两个句子S1和S2,任务目标是判断这两个句子是否具备某种类型的关系。本文用机器学习算法实现了一种有监督的句子对匹配方法,使用的机器学习分类算法有:逻辑回归(LR)、SVM、GBDT和随机森林(RandomForest),使用的工具是Sklearn。并在Quora公开的一个数据集上做了一些对比试验。
2017-06-01 22:41:38 8565
原创 深度学习笔记——基于Word2vec和Doc2vec的句子对匹配方法
句子对匹配(Sentence Pair Matching)问题是NLP中非常常见的一类问题,所谓“句子对匹配”,就是说给定两个句子S1和S2,任务目标是判断这两个句子是否具备某种类型的关系。本文是一个Word2vec和Doc2vec的应用,使用Word2vec和Doc2vec得到句子的向量表示,然后计算cosin相似度,本文在Quora公开的一个数据集上做了一些对比试验,是一种无监督的句子对匹配方法。
2017-06-01 22:39:24 12440 4
原创 层次聚类实例以及Java实现
本文主要讲述一个层次聚类实例,使用层次聚类算法将相似图书的目录进行聚类。由于不知道要聚为多少类,所以Kmeans聚类算法不适用,而层次聚类由于不需要设置聚类中心数,只要传递一个阈值即可,所以正好适合于这个问题。本文将结合层次聚算法的原理以及其Java代码实现来展现文本聚类的一个实现方式。具体代码见我的GitHub(点击打开链接)
2017-05-22 12:16:11 6779 2
原创 深度学习笔记——Word2vec和Doc2vec应用举例:词和句子的相似度计算
本文主要介绍一个Word2vec和Doc2vec应用示例:用Word2vec和Doc2vec做句子相似度计算。
2017-05-18 21:45:54 23196 3
原创 深度学习笔记——Word2vec和Doc2vec训练实例以及参数解读
本篇主要用一个实例来介绍一下如何进行Word2vec和Doc2vec的训练,并对Word2vec和Doc2vec模型训练过程中的参数进行一些解读。使用的是Python版本的gensim库实现,想要了解Word2vec和Doc2vec的原理可以查看我的上一篇博客( 深度学习笔记——Word2vec和Doc2vec原理理解并结合代码分析)。代码见我的GitHub(使用Gensim库训练Word2vec和Doc2vec模型)
2017-05-18 21:43:37 18965 1
原创 深度学习笔记——Word2vec和Doc2vec原理理解并结合代码分析
一直在用Word2vec和Doc2vec做Embedding,但是刚开始用的时候对其原理一直是一知半解,只是知道怎么用而已。古人云:既要知其然,也要知其所以然。所以,结合作者论文,以及网上各位前辈的博客和开源代码之后,抽空写写自己对Word2vec和Doc2vec原理的理解,以及结合代码做一些分析。希望能够有用,有错误也请各位朋友批评指正!
2017-05-18 10:16:54 47858 6
原创 深度学习笔记——情感分析
本文使用三种深度学习方法对IMDB评论进行情感分析。这三种方法为:MLP、BiRNN(LSTM、GRU)、BiGRU+Attention。
2017-05-11 22:14:06 34994 23
原创 从MLP到神经网络
先看一下来自维基百科的介绍:多层感知器(Multilayer Perceptron,缩写MLP)是一种前向结构的人工神经网络,映射一组输入向量到一组输出向量。MLP可以被看作是一个有向图,由多个的节点层所组成,每一层都全连接到下一层。除了输入节点,每个节点都是一个带有非线性激活函数的神经元(或称处理单元)。一种被称为反向传播算法的监督学习方法常被用来训练MLP。MLP是感知器的推广,克服了感知
2017-03-15 15:24:17 20126
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人