1.embedding :嵌入,通常指深度学习中将数据集中字符转化为向量,因为神经网络仅能接收张量,所以需要进行一个类似于编码的过程。而这个过程一般不会在paper中做,一般直接拿别人的。如glove,word2vec。
2.end-to-end:端到端,指模型中不经过人工处理,从输入数据直接到输出数 据。如将数据经过一个embedding,然后经过训练出来直接就是如NEG,POS等分类。而中间如果没有embedding,自己编码,那就不是端到端。
3.baseline:实验的对比组,以验证模型的提升。
4.query:意图,在NLP过程中用户产生的需求,根据query可以进行后续的分类等工作。
5.dependency tree:依存树,用以表达句子中词语的依存关系,即主谓宾等关系。其节点由词语构成
6.constituent tree:短语结构树,用以表达句法结构,即动词,名词,形容词等。仅有根节点为句子中词语。
7.FM:分解机,用以对二阶权重进行分解为隐向量乘积的形式,从而进行优化。
8.GRU:LSTM的变体,通过改变门控单元,减少了需要学习的参数数量,从而一定程度上减少了过拟合
9.SRU:LSTM的变体,通过对每个输入先单独处理,再引入其他输入信息的方法,优化了LSTM速度,使其从串行改为了并行计算,性能和原LSTM接近。
记一些阅读paper时的名词
最新推荐文章于 2024-06-11 09:36:24 发布