知识图谱课程学习-2-4知识图谱的向量表示方法

最新推荐文章于 2024-07-11 17:26:33 发布

萌新滴程序员

最新推荐文章于 2024-07-11 17:26:33 发布

阅读量158

点赞数 2

文章标签：知识图谱学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/w_gun/article/details/140146897

版权

从词的向量表示讲起：

One-hot Encoding：

每个词的大小就是词典的大小。缺点：空间消耗比较大。

Bag-of-words：

文档向量表示，词出现的次数作为数值，词典大小为文档的大小。缺点：无法表示词的语义。

词的分布式向量表示：

词的语义是由什么决定？

词是符号化的，词的语义由它被使用的上下文确定。

Word Embedding（词嵌入）：

通过统计词上下文语义规律，并通过词的上下文计算词的分布式规律。

每一个维度都是有数值的，维度远远低于词库大小，通过语料统计学习出来的。称为低维稠密的向量表示，也叫词的嵌入表示。

词向量学习模型举例：

CBow：wordtoword的模型，前几个词和后几个词预测中间的词。

Skip-gram：中间词预测前后的几个词。

One-hot Encoding：任意两两之间相似度为0

词嵌入->知识图谱嵌入：

知识图谱嵌入模型-TransE：

给定一个三元组，h代表主语，r代表谓语，t宾语。

h+r=t

知识图谱嵌入模型-DistMult：

h*Mr=t

知识图谱嵌入模型：推理问题

测试三元组（h，r，t）：尾实体预测（h，r，？）or 头实体预测（？，r，t）

萌新滴程序员

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
知识图谱课程学习-2-4知识图谱的向量表示方法

每一个维度都是有数值的，维度远远低于词库大小，通过语料统计学习出来的。称为低维稠密的向量表示，也叫词的嵌入表示。文档向量表示，词出现的次数作为数值，词典大小为文档的大小。缺点：无法表示词的语义。测试三元组（h，r，t）：尾实体预测（h，r，？CBow：wordtoword的模型，前几个词和后几个词预测中间的词。通过统计词上下文语义规律，并通过词的上下文计算词的分布式规律。每个词的大小就是词典的大小。词是符号化的，词的语义由它被使用的上下文确定。Skip-gram：中间词预测前后的几个词。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。