LSTM
文章平均质量分 91
Amy_mm
https://github.com/xuman-Amy
积跬步,至千里
展开
-
LSTM实现简单的问答系统,keras的bAbI
3.3 LSTM实现简单的问答系统3.3.1 问答系统简介3.3.2 基于keras实现简单的问答系统模型逻辑图如下: 数据集:Facebook的bAbI数据 训练集: 1 Mary moved to the bathroom.2 Sandra journeyed to the bedroom.3 Mary got the football there.4...原创 2018-07-17 17:07:32 · 6777 阅读 · 13 评论 -
LSTM古诗生成
RNN的类别:循环神经网络主要应用于序列数据的处理,因输入与输出数据之间有时间上的关联性,所以在常规神经网络的基础上,加上了时间维度上的关联性,也就是有了循环神经网络。因此对于循环神经网络而言,它能够记录很长时间的历史信息,即使在某一时刻有相同的输入,但由于历史信息不同,也会得到不同的输出,这也是循环神经网络相比于常规网络的不同之处。 根据输入与输出之间的对应关系,可以将循环神经网络分为以下...原创 2018-07-25 20:00:01 · 13467 阅读 · 2 评论 -
paper notes 《Chinese NER Using Lattice LSTM》
paper title:《Chinese NER Using Lattice LSTM》摘要对于中文命名实体识别,我们研究了一种lattice结构的lstm模型(lattice-structured LSTM),这个模型能够对输入的字符序列以及序列中能够与字典相匹配的隐藏的词信息一同编码。相比于基于字粒度的方法,lattice的能够更好的利用字以及字序列的信息。相比于词粒度的方法,...原创 2018-08-23 10:21:02 · 3860 阅读 · 1 评论 -
DNN中的BP和RNN中的BPTT推导
1.5、BP和BPTT参考博客:http://www.cnblogs.com/pinard/p/6509630.html1、反向传播算法(Backpropagation)反向传播算法要解决的问题深层神经网络(Deep Neural Network,DNN)由输入层、多个隐藏层和输出层组成,任务分为分类和回归两大类别。如果我们使用深层神经网络做了一个预测任务,预测输出为ỹ&nb...原创 2018-07-12 11:59:23 · 2797 阅读 · 0 评论 -
中文序列标注系列(绪)
先立个FLAG写一个比较完善的中文序列标注系列因为最近接触的序列标注比较多,主要是做命名实体识别,区别于之前的主要是类别是多种,不仅限于人名地名机构;模型主要是用了经典的BiLSTM+CRF,BERT,以及二者结合的模型。博主渣渣,代码主要参考git上大佬的分享代码,此系列主要记录序列标注的原理,代码的注释,以及自己阅读的相关论文笔记。关于序列标注的统计学习方法主要是HMM,MEMM,CRF...原创 2019-05-31 23:05:21 · 1149 阅读 · 1 评论 -
《Adversarial Transfer Learning for Chinese Named Entity Recognition with Self-Attention Mechanism》阅读
《Adversarial Transfer Learning for Chinese Named Entity Recognition with Self-Attention Mechanism》paper publisher: ACL 2018方向:NERsource code: https://github.com/CPF-NLPR/AT4ChineseNER摘要中文NER缺少大...原创 2019-06-16 19:45:57 · 2489 阅读 · 0 评论