知识图谱课程学习-2-4知识图谱的向量表示方法

从词的向量表示讲起:

    One-hot Encoding:

        每个词的大小就是词典的大小。缺点:空间消耗比较大。

   

    Bag-of-words:

        文档向量表示,词出现的次数作为数值,词典大小为文档的大小。缺点:无法表示词的语义。

词的分布式向量表示:

    词的语义是由什么决定?

        词是符号化的,词的语义由它被使用的上下文确定。

Word Embedding(词嵌入):

    通过统计词上下文语义规律,并通过词的上下文计算词的分布式规律。

    每一个维度都是有数值的,维度远远低于词库大小,通过语料统计学习出来的。称为低维稠密的向量表示,也叫词的嵌入表示。

词向量学习模型举例:

    CBow:wordtoword的模型,前几个词和后几个词预测中间的词。

    Skip-gram:中间词预测前后的几个词。

One-hot Encoding:任意两两之间相似度为0

词嵌入->知识图谱嵌入:

知识图谱嵌入模型-TransE:

    给定一个三元组,h代表主语,r代表谓语,t宾语。

    h+r=t

知识图谱嵌入模型-DistMult:

    h*Mr=t

知识图谱嵌入模型:推理问题

    测试三元组(h,r,t):尾实体预测(h,r,?)or 头实体预测(?,r,t)

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值