cs224u: Vector-space models: retrofitting

最新推荐文章于 2022-12-17 22:42:41 发布

段智华

最新推荐文章于 2022-12-17 22:42:41 发布

阅读量359

点赞数

分类专栏： AI内幕之NLP+盘古深度学习框架+机器学习+Alluxio

热烈祝贺Gavin大咖2024年北京航空航天大学两本新书《Transformer&ChatGPT解密：原理、源码及案例》、《Transformer& Rasa 解密: 原理、源码及案例》出版发行

本文链接：https://blog.csdn.net/duan_zhihua/article/details/105886880

版权

AI内幕之NLP+盘古深度学习框架+机器学习+Alluxio 专栏收录该内容

123 篇文章 297 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨了如何将结构化信息（如标签）融入词向量表示，通过改造模型来提升词向量的表达能力。介绍了Faruqui 2016的改造方法，该方法通过更新节点表示，使连接的节点更接近，从而结合共现数据和标记数据的优势。文章还展示了不同节点连接情况下的转换效果，并提到了其他改造模式和未来发展方向，如图嵌入和反义词处理。

摘要由CSDN通过智能技术生成

Vector-space models: retrofitting 概述

•到目前为止，我们词向量中的所有信息都仅仅来自文本中的共现模式。这些信息通常很容易获得——尽管人们确实需要大量的文本——而且令人吃惊的是，由此产生的表示形式是多么丰富。
•尽管如此，很明显，我们会错过一些重要的信息。例如，学习能够支持所有小狗都是狗（小狗属狗）这一推论的表示可能很简单，但学习狗属哺乳动物可能很困难，因为文本中使用非常广泛的分类术语（如哺乳动物）的方式很不寻常。
•接下来的问题是：我们如何将结构化信息（标签）纳入我们的表述？如果我们能做到这一点，那么我们可能会得到两方面的好处：使用共现数据的方便性和使用标记数据的优化。

•本文我们将看到一种强大的方法：对Faruqui 2016等人的模型进行改造。在这个模型中，学习（或下载）知识图中节点的分布式表示，然后更新这些表示，使连接的节点更接近彼此。

•这是一个非常丰富的想法；本文回顾了一些最近的扩展，新的扩展可能会一直出现。

The retrofitting model

对于大小为m×n的VSM Q^和一组边E（Q^中行的索引对），改造目标是根据以下函数获得新的VSM Q（m×n）：

<

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

段智华 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。