CS224n: Natural Language Processing with Deep Learning 笔记、文献及知识点整理(五)词向量(五)

本文详细介绍了词向量GloVe在外部任务训练中的应用,包括问题表述、词向量的再训练、Softmax分类与正则化、窗口分类和非线性分类器。讨论了重新训练词向量的风险,以及在NLP任务中防止过拟合的正则化策略。
摘要由CSDN通过智能技术生成

词向量II:GloVe、评估和训练

关键词:全局向量词表示 (GloVe)、内在和外在评估、超参数对类比评估任务的影响、人类判断与词向量距离的相关性、 使用上下文处理单词中的歧义、窗口分类。

本文上一部分请见:CS224n: Natural Language Processing with Deep Learning 笔记、文献及知识点整理(四)词向量(四)_放肆荒原的博客-CSDN博客

3. 外部任务训练

到目前为止,我们一直关注内在任务,并强调它们在开发良好的单词嵌入技术中的重要性。不过大多数现实问题是将结果词向量用于一些外部任务。我们先来看看处理外部任务的一般方法。

3.1 问题表述

图5:可以使用简单的线性决策边界对词向量进行分类

如图所示(二维词向量),使用逻辑回归和支持向量机等技术 

大多数 NLP 外在任务可以表述为分类任务。 例如,给定一个句子,我们可以将句子分类为积极、消极或中性情绪。 类似地,在命名实体识别 (NER) 中,给定上下文和中心词,我们希望将中心词分类为许多类别之一。 对于输入“Jim 在 2006 年购买了 Acme Corp. 的 300 股”,我们希望分类输出“[Jim]Person 在 [2006]Time 年购买了 [Acme Corp.]Organization 的 300 股”。

对于此类问题,我们通常从以下形式的训练集开始:

其中,是通过某种单词嵌入技术生成的d维单词向量,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值