知识图谱学习——词向量相关

1、Glove(Global Vectors for Word representation):基于全局词频统计的词表达工具,把单词表达成一个由实数组成的向量。

 

 

2、word2vec  是Google研究团队里的Tomas Mikolov等人于2013年的《Distributed Representations ofWords and Phrases and their Compositionality》以及后续的《Efficient Estimation of Word Representations in Vector Space》两篇文章中提出的一种高效训练词向量的模型,基本出发点和Distributed representation类似:上下文相似的两个词,它们的词向量也应该相似,比如香蕉和梨在句子中可能经常出现在相同的上下文中,因此这两个词的表示向量应该就比较相似。

word2vec的基本思想

句子之中相近的词之间是有联系的,比如今天后面经常出现上午、下午。所以它的基本思想就是用词来预测词。(准确的说,word2vec仍然是一种编码方式,将一个个的词给编码成向量,但是被他编码而成的向量并不是随便生成的,而是能够体现这些单词之间的关系(如相似性等))

知乎连接:word2vec详解-基础 - 知乎

 Numpy & pandas

知乎连接:Numpy&Pandas 傻傻分不清楚? - 知乎

3、token和tokenization

tokenization就是通常所说的分词,分出的每一个词语我们把它称为token

4、cls_token的作用
cls_token与图像无关。它是随机生成的,不基于图像内容,因此可以避免对sequence中某个特定token的偏向性。
cls_token 对所有其他token上的信息做汇聚(全局特征聚合),cls_token(第0个token)使用固定的位置编码能够避免输出受到位置编码的干扰。(本段为CSDN博主「gltangwq」的原创文章,
原文链接:https://blog.csdn.net/gltangwq/article/details/124950935)

5、多头注意力机制:拥有多套QKV训练出多个特征

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
知识图谱中的知识推理方法可以分为以下几个主要分类: 1. 基于规则的推理:这种推理方法基于事先定义的规则,通过匹配已有的知识图谱中的事实和规则,推断出新的信息。这些规则可以是逻辑规则、条件语句或模式匹配规则。例如,如果规则定义了"A是B的子类,B是C的子类,则可以推断A是C的子类"。 2. 基于逻辑的推理:这种推理方法利用形式化逻辑进行推理,包括一阶逻辑和描述逻辑。通过对知识图谱中的关系和实体进行逻辑推理,从而得出新的结论。常用的逻辑推理方法包括前向推理、后向推理和双向推理。 3. 基于语义相似度的推理:这种推理方法通过计算实体之间的语义相似度,判断它们是否具有相似的特征或关系。可以使用向量模型(如Word2Vec、BERT)或知识图谱中的语义关系(如路径相似度、语义关联度)来计算实体之间的相似度,并基于相似度进行推理。 4. 基于统计学习的推理:这种推理方法利用统计模型和机器学习算法对知识图谱进行建模和预测。通过分析已有数据,学习实体之间的关系,并利用这些关系进行推理。常用的统计学习方法包括概率图模型、决策树、支持向量机等。 5. 基于图算法的推理:这种推理方法利用图算法(如图遍历、图匹配、图剪枝等)对知识图谱进行分析和推理。通过遍历图中的节点和边,发现节点之间的关联关系和规律,并利用这些关系进行推理。 以上是知识图谱中常见的知识推理方法分类。不同的推理方法可以根据具体的应用场景和需求进行选择和组合使用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值