![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文
文章平均质量分 81
Doit_行之
这个作者很懒,什么都没留下…
展开
-
读论文《A Neural Probabilistic Language Model》
introduce本文算是训练语言模型的经典之作,Bengio将神经网络引入语言模型的训练中,并得到了词嵌入这个副产物。词嵌入对后面深度学习在自然语言处理方面有很大的贡献,也是获取词的语义特征的有效方法。原创 2017-08-22 16:44:01 · 2244 阅读 · 0 评论 -
读论文《Natural Language Processing (Almost) from Scratch》
本文也是神经网络语言模型和词嵌入的经典论文,本文与之前的《A Neural Probabilistic Language Model》模型的不同在于,本文的核心目标是训练好的word embedding以完成词性标注 (POS)、短语识别(CHUNK)、命名实体识别原创 2017-08-23 13:34:47 · 7029 阅读 · 2 评论 -
读论文《The perceptron: A probabilistic model for information storage and organization in the brain》
这篇论文是神经网络的开山之作,在论文中Rosenblatt提出了感知机(perceptron),为后来对人工神经网络的研究奠定了基础。原创 2017-08-27 15:43:12 · 5925 阅读 · 3 评论 -
读论文《Efficient Estimation of Word Representations in Vector Space》
词的分布式表示(又称词嵌入,word embedding)因为这篇文章开始大火,原来的word embedding只是神经网络语言模型的副产物,而该论文的主要的目标是训练具有语义特征的word embedding。原创 2017-08-23 23:13:44 · 2340 阅读 · 0 评论 -
读论文《Distributed Representations of Words and Phrases and their Compositionality》
这篇论文是对《Efficient Estimation of Word Representations in Vector Space》的补充,介绍了使用Skip-gram模型和Hierarchical Softmax训练模式的训练方法。并补充了Negative Sampling的训练模式替代Negative Sampling,获得更快的训练效果。原创 2017-08-24 00:35:43 · 3874 阅读 · 1 评论 -
读论文《Recurrent neural network based language model 》
本文将循环神经网络RNN引入了神经网络语言模型,用RNN对历史信息的存储代替以n为窗口的上下文。作者将语言模型中的隐藏层作为状态存储单元,以当前单词的词嵌入和上一状态的叠加作为输入,输出对下一个单词的预测。原创 2017-08-24 12:51:25 · 2845 阅读 · 0 评论 -
读论文《Convolutional Neural Networks for Sentence Classification》
这篇论文把卷积神经网络用到了句子分类中,算是把卷积神经网络的应用范围扩大到了nlp领域。作者将句子中的词用word embedding代表,从上到下排列构成了一个矩阵。这个矩阵就相对于句子的语义特征图。然后就可以对这个语义特征图进行卷积。原创 2017-08-29 00:28:50 · 1589 阅读 · 0 评论 -
读论文《Auto-Encoding Variational Bayes》
这篇论文将变分贝叶斯和神经网络结合起来,用神经网络学习变分推导的参数,以得到后验推理p(z|x)的似然,并获得了一个效果不错的生成模型-变分自编码器原创 2017-08-31 11:15:27 · 18547 阅读 · 6 评论 -
读论文《Semi-Supervised Recursive Autoencoders for Predicting Sentiment Distributions》
读论文《Semi-Supervised Recursive Autoencoders for Predicting Sentiment Distributions》文章主要介绍了使用递归自编码器做句子情感分类的方法。和之前的方法相比,本文的算法没有使用任何预设定的情感词汇和极性转换规则。并在movie reviews数据集上取得了SOTA的效果。当时主流的方法还是词袋模型,但词袋模型无法很好的...原创 2019-03-28 22:50:57 · 740 阅读 · 0 评论