自然语言处理
文章平均质量分 73
thriving_fcl
这个作者很懒,什么都没留下…
展开
-
plsa(Probabilistic Latent Semantic Analysis) 概率隐语义分析
plsa,也就是概率隐语义分析,是主题模型的一种。本文简介主题模型的概念,讲解plsa如何估计主题模型中的参数,以及算法的推导过程及代码实现原创 2016-03-13 17:07:45 · 5001 阅读 · 0 评论 -
word2vec (一) 简介与训练过程概要
word2vec、词向量空间、概率语言模型、word2vec训练过程简介原创 2016-05-14 10:45:07 · 15065 阅读 · 0 评论 -
word2vec (二) CBOW
未完待续…原创 2016-05-14 10:50:54 · 1250 阅读 · 0 评论 -
word2vec (四) 动手训练一个词向量空间
word2vec 使用实例原创 2016-05-14 16:40:12 · 14160 阅读 · 3 评论 -
用于文本分类的RNN-Attention网络
这篇博客主要介绍Attention机制在文本分类任务上的作用,原理以及附带的代码实现。原创 2017-06-17 15:51:15 · 30638 阅读 · 4 评论 -
FastText 文本分类使用心得
fasttext文本分类原创 2016-11-20 12:01:07 · 24434 阅读 · 26 评论 -
用于文本相似的Siamese Network
Siamese Network简介Siamese Network 是一种神经网络的框架,而不是具体的某种网络,就像seq2seq一样,具体实现上可以使用RNN也可以使用CNN。简单的说,Siamese Network用于评估两个输入样本的相似度。网络的框架如下图所示Siamese Network有两个结构相同,且共享权值的子网络。分别接收两个输入X1X_1与X2X_2,将其转换为向量Gw(X1)G_原创 2017-06-25 23:00:45 · 15293 阅读 · 12 评论 -
CoreNLP Python接口处理中文
CoreNLP 项目是Stanford开发的一套开源的NLP系统。包括tokenize, pos , parse 等功能,与SpaCy类似。SpaCy号称是目前最快的NLP系统, 并且提供现成的python接口,但不足之处就是目前还不支持中文处理, CoreNLP则包含了中文模型,可以直接用于处理中文, 但CoreNLP使用Java开发,python调用稍微麻烦一点。原创 2017-08-02 19:03:24 · 13923 阅读 · 2 评论 -
Tensorflow新版Seq2Seq接口使用
Tensorflow 1.0.0 版本以后,开发了新的seq2seq接口,弃用了原来的接口。旧的seq2seq接口也就是tf.contrib.legacy_seq2seq下的那部分,新的接口在tf.contrib.seq2seq下。新seq2seq接口与旧的相比最主要的区别是它是动态展开的,而旧的是静态展开的。原创 2017-07-02 23:50:08 · 43957 阅读 · 17 评论