mpk_no1-CSDN博客

原创深度学习笔记——利用深度学习构建社区问答系统之相似问题对匹配

深度学习笔记——利用深度学习构建社区问答系统之相似问题对匹配

2017-08-06 23:27:53 5667 8

原创深度学习笔记——基于双向RNN（LSTM、GRU）和Attention Model的句子对匹配方法

本文主要是结合RNN和Attention Model做一些关于句子对匹配的模型总结。

2017-08-06 23:06:07 35905 4

原创深度学习笔记——Attention Model（注意力模型）学习总结

Attention Model（注意力模型）学习总结，包括soft Attention Model，Global Attention Model和Local Attention Model，静态AM，强制前向AM的一些介绍，以及AM具体实现公式的几个变体及介绍，最后附上了自己用keras实现的一个静态AM的代码。

2017-08-06 21:49:46 153532 15

原创 8大经典排序算法及其实现代码

8大经典排序算法及其实现代码插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序

2017-07-30 23:21:33 1882

原创频繁项挖掘-Apriori算法

频繁项挖掘-Apriori算法

2017-07-24 22:50:38 1554 1

原创深度学习笔记——RNN（LSTM、GRU、双向RNN）学习总结

本文是关于RNN和RNN的变种LSTM、GRU以及BiRN的学习总结。

2017-07-23 22:27:47 76510 9

原创自动编码器AutoEncoder学习总结

自编码器AutoEncoder学习总结，整理AutoEncoder的原理，AutoEncoder在分类任务上的使用，稀疏AE，以及对AE改进得到文档或句子向量表达的一篇paper（KATE: K-Competitive Autoencoder for Text）（KDD2017）

2017-07-23 21:01:16 15400 1

原创关键词提取方法学习总结（TF-IDF、Topic-model、RAKE）

关键词提取方法学习总结（TF-IDF、Topic-model、RAKE）

2017-07-23 16:07:02 37771 2

原创常见分词工具总结

常见分词工具总结Stanford NLP中科院计算所ICTCLASAnsjHanLPjiebaJcsegFudanNLP

2017-07-23 15:18:40 7122

原创文本相似度计算的几个距离公式（欧氏距离、余弦相似度、Jaccard距离、编辑距离）

本文主要讲一下文本相似度计算的几个距离公式，主要包括：欧氏距离、余弦相似度、Jaccard距离、编辑距离。距离计算在文本很多场景下都可以用到，比如：聚类、K近邻、机器学习中的特征、文本相似度等等。

2017-06-08 21:57:14 44865 1

原创深度学习笔记——TensorFlow学习笔记（三）使用TensorFlow实现的神经网络进行MNIST手写体数字识别

本文是TensorFlow学习的第三部分，参考的是《TensorFlow实战Google深度学习框架》一书，这部分讲述的是使用TensorFlow实现的神经网络进行MNIST手写体数字识别一个实例。这个实例将第二部分讲述的激活函数、损失函数、优化算法、正则化等都运用上了。同时，使用TensorFlow中利用变量名称来创建/获取变量的机制将前向传播的过程抽象出来，使得训练和测试时不需要关心神经网络的结构或是参数；还使用了TensorFlow保存模型的方法将模型持久化（保存），以及加载模型进行预测。

2017-06-04 00:20:59 6903 3

原创深度学习笔记——TensorFlow学习笔记（二）激活函数、损失函数、优化算法和正则项

本文是TensorFlow学习的第二部分，主要学习的是激活函数、损失函数、优化方法和正则项，以及在TensorFlow中的实现。

2017-06-03 22:40:54 2827 1

原创深度学习笔记——TensorFlow学习笔记（一）入门

本文只是在学习TensorFlow前期的一些入门知识总结，并结合一个用TensorFlow实现神经网络的例子来进一步加深对TensorFlow的理解。

2017-06-02 22:54:11 5712 3

原创深度学习笔记——基于传统机器学习算法（LR、SVM、GBDT、RandomForest）的句子对匹配方法

句子对匹配（Sentence Pair Matching）问题是NLP中非常常见的一类问题，所谓“句子对匹配”，就是说给定两个句子S1和S2，任务目标是判断这两个句子是否具备某种类型的关系。本文用机器学习算法实现了一种有监督的句子对匹配方法，使用的机器学习分类算法有：逻辑回归（LR）、SVM、GBDT和随机森林（RandomForest），使用的工具是Sklearn。并在Quora公开的一个数据集上做了一些对比试验。

2017-06-01 22:41:38 8565

原创深度学习笔记——基于Word2vec和Doc2vec的句子对匹配方法

句子对匹配（Sentence Pair Matching）问题是NLP中非常常见的一类问题，所谓“句子对匹配”，就是说给定两个句子S1和S2，任务目标是判断这两个句子是否具备某种类型的关系。本文是一个Word2vec和Doc2vec的应用，使用Word2vec和Doc2vec得到句子的向量表示，然后计算cosin相似度，本文在Quora公开的一个数据集上做了一些对比试验，是一种无监督的句子对匹配方法。

2017-06-01 22:39:24 12440 4

原创层次聚类实例以及Java实现

本文主要讲述一个层次聚类实例，使用层次聚类算法将相似图书的目录进行聚类。由于不知道要聚为多少类，所以Kmeans聚类算法不适用，而层次聚类由于不需要设置聚类中心数，只要传递一个阈值即可，所以正好适合于这个问题。本文将结合层次聚算法的原理以及其Java代码实现来展现文本聚类的一个实现方式。具体代码见我的GitHub（点击打开链接）

2017-05-22 12:16:11 6779 2

原创深度学习笔记——Word2vec和Doc2vec应用举例：词和句子的相似度计算

本文主要介绍一个Word2vec和Doc2vec应用示例：用Word2vec和Doc2vec做句子相似度计算。

2017-05-18 21:45:54 23196 3

原创深度学习笔记——Word2vec和Doc2vec训练实例以及参数解读

本篇主要用一个实例来介绍一下如何进行Word2vec和Doc2vec的训练，并对Word2vec和Doc2vec模型训练过程中的参数进行一些解读。使用的是Python版本的gensim库实现，想要了解Word2vec和Doc2vec的原理可以查看我的上一篇博客（深度学习笔记——Word2vec和Doc2vec原理理解并结合代码分析）。代码见我的GitHub（使用Gensim库训练Word2vec和Doc2vec模型）

2017-05-18 21:43:37 18965 1

原创深度学习笔记——Word2vec和Doc2vec原理理解并结合代码分析

一直在用Word2vec和Doc2vec做Embedding，但是刚开始用的时候对其原理一直是一知半解，只是知道怎么用而已。古人云：既要知其然，也要知其所以然。所以，结合作者论文，以及网上各位前辈的博客和开源代码之后，抽空写写自己对Word2vec和Doc2vec原理的理解，以及结合代码做一些分析。希望能够有用，有错误也请各位朋友批评指正！

2017-05-18 10:16:54 47858 6

原创深度学习笔记——情感分析

本文使用三种深度学习方法对IMDB评论进行情感分析。这三种方法为：MLP、BiRNN（LSTM、GRU）、BiGRU+Attention。

2017-05-11 22:14:06 34994 23

原创从MLP到神经网络

先看一下来自维基百科的介绍：多层感知器（Multilayer Perceptron,缩写MLP）是一种前向结构的人工神经网络，映射一组输入向量到一组输出向量。MLP可以被看作是一个有向图，由多个的节点层所组成，每一层都全连接到下一层。除了输入节点，每个节点都是一个带有非线性激活函数的神经元（或称处理单元）。一种被称为反向传播算法的监督学习方法常被用来训练MLP。MLP是感知器的推广，克服了感知

2017-03-15 15:24:17 20126

mpk_no1的博客