读Glove论文笔记

1.Glove 背景介绍

《Glove: Global Vectors for Word Representation》

# 1.论文导读

1.论文的背景知识

词的表示方法

  • 矩阵分解方法

    (Matrix Factorization Methods)

    词共现矩阵

    1. I enjoy flying 。
    2. I like NLP。
    3. I like deep learning。

    image

    缺点: 在词对推理任务上表示特别差。

  • 基于上下文的向量学习方法

    (Shallow Window-Based Methods)

    Word2Vec

    image

    缺点:无法使用全局的统计信息。

2. 论文的研究成果

  • 在词对推理数据集上取得最好的结果
  • 公布了一系列基于Glove 的预训练词向量

image

3.Glove历史意义

  • 推动了基于深度学习的自然语言处理的发展

image

image

2.论文精度

1.论文结构

  • 论文总览

image

  • 论文摘要

    1. 当前词向量学习模型能够通过向量的算术计算捕捉词之间细微的语法和语义规律,但是这种规律背后的原理依旧不清楚
    2. 经过仔细的分析,我们发现了一些有助于这种词向量规律的特性,并基于词提出了一种新的对数双线性回归模型,这种模型能够利用全局矩阵分解和局部上下文的优点来学习词向量。
    3. 我们的模型通过只在共线矩阵中的非0位置训练达到高效训练的目的。
    4. 我们的模型在词对推理任务上得到75%的准确率,并且在多个任务上得到最优结果。
  • 论文的小标题

  1. Introduction

  2. Related Work

    2.1 Matrix Factorization Methods

    2.2 Shallow Window Based Methods

  3. The GloVe Model

    3.1 Relationship to Other Models

    3.2 Complexity of the model

  4. Experiments

    4.1 Evaluation methods

    4.2 Corpora and training details

    4.3 Results

    4.4 Model Analysis: Vector Length and Context Size

    4.5 Model Analysis: Corpus Size

    4.6 Model Analysis: Run-time

    4.7 Model Analysis : Comparison with word2vec

  1. Conclusion

2. GloVe 模型

image

观察分析

原理:我们可以使用一些词来描述一个词,比如我们使用冰块和蒸汽来描述固体、气体、水和时尚四个词。

  • 与冰块接近,并且和蒸汽不接近:固体并且概率比值很大
  • 与蒸汽接近,并且和冰块不接近:气体并且概率比值很小
  • 与冰块和蒸汽都不接近: 水和时尚并且概率比值不大不小

结论:共线矩阵的概率比值可以用来区分词。

image

3. 公式推导

image

image

  • 求得的损失函数

image

  • 原理:词对出现次数越多,那么这两个词在loss函数中的影响越大。

f(Xij)需要满足:

  1. Xij=0时, f(Xij) = 0 : 表示没有共线过的权重为0, 不参加训练
  2. 非减函数,因为共线次数越多,权重越大
  3. f(Xij)不能无限制的大,防止is, are, the的影响

image

image

3. 实验结果分析

  • 在词对推理数据集上取得最好得结果

image

  • 多个词相似度任务上取得最好得结果

    image

  • 命名实体识别实验结果

image

  • 向量长度对结果的影响
  • 窗口大小对结果的影响

image

  • 训练语料对结果的影响

image

  • 和Word2vec对比实验

image

4.论文总结

1.解词向量学习方法

  • 基于上下文的词向量学习方法
  • 预训练词向量

2.创新点

  • 提出了一种新的词向量训练模型-- Glove
  • 在多个任务上取得最好的结果
  • 公布了一系列预训练的词向量

3. 启发点

  • 相对于原始的概率,概率的比值更能够区分相关的词和不相关的词,并且能够区分两种相关的词。
  • 提出了一种新的对数双线性回归模型,这种模型结合全局矩阵分解和局部上下文的优点。
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值