CS224n: Natural Language Processing with Deep Learning 笔记、文献及知识点整理（五）词向量（五）

最新推荐文章于 2024-09-14 19:18:15 发布

放肆荒原

最新推荐文章于 2024-09-14 19:18:15 发布

阅读量508

点赞数

分类专栏： NLP AI 文章标签：深度学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_53111034/article/details/121810492

版权

本文详细介绍了词向量GloVe在外部任务训练中的应用，包括问题表述、词向量的再训练、Softmax分类与正则化、窗口分类和非线性分类器。讨论了重新训练词向量的风险，以及在NLP任务中防止过拟合的正则化策略。

摘要由CSDN通过智能技术生成

词向量II：GloVe、评估和训练

关键词：全局向量词表示 (GloVe)、内在和外在评估、超参数对类比评估任务的影响、人类判断与词向量距离的相关性、使用上下文处理单词中的歧义、窗口分类。

本文上一部分请见：CS224n: Natural Language Processing with Deep Learning 笔记、文献及知识点整理（四）词向量（四）_放肆荒原的博客-CSDN博客

3. 外部任务训练

到目前为止，我们一直关注内在任务，并强调它们在开发良好的单词嵌入技术中的重要性。不过大多数现实问题是将结果词向量用于一些外部任务。我们先来看看处理外部任务的一般方法。

3.1 问题表述

图5：可以使用简单的线性决策边界对词向量进行分类

如图所示（二维词向量），使用逻辑回归和支持向量机等技术

大多数 NLP 外在任务可以表述为分类任务。例如，给定一个句子，我们可以将句子分类为积极、消极或中性情绪。类似地，在命名实体识别 (NER) 中，给定上下文和中心词，我们希望将中心词分类为许多类别之一。对于输入“Jim 在 2006 年购买了 Acme Corp. 的 300 股”，我们希望分类输出“[Jim]Person 在 [2006]Time 年购买了 [Acme Corp.]Organization 的 300 股”。

对于此类问题，我们通常从以下形式的训练集开始：

其中，是通过某种单词嵌入技术生成的d维单词向量，

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。