论文笔记《Knowledge Enhanced Contextual Word Representations》

Motivition

作者的出发点有几个:

  1. 尽管BERT这种预训练模型取得了state-of-art的成绩。但是、因为他们没有包含真实世界的实体,所以导致这些模型也很难覆盖真实世界的知识
    没有实体没有知识怎么办呢?Knowledge bases、知识库有。
  2. 知识库不仅拥有丰富的高质量、人类产生的知识,而且他们包含与原始文本中互补的信息,还能够编码事实性的知识。所以用知识库可以解决因不频繁出现但是常识的mention或者长距离依赖造成的难以学习选择偏好的问题

一些解释

  1. 实体(Entity):知识库中完整定义的,唯一存在的条目,每一个实体都可以看作是指代它的名词短语或代词构成的集合
    例:(巴拉克-奥巴马={美国总统,奥巴马,第44任美国总统,他})。
  2. 指称(mention):实体在自然语言文本中的别名或另一种指代形式。
    例:美国总统(名词词组)、奥巴马(命名实体)、第44任美国总统、他(代词)等。
  3. 选择偏好(Selectional Preference):动词的倾向性。谓语(Predicate)对其论元(Argument)是有一定选择倾向性的,不是什么词语都可以通过简单排列组合进行搭配的。[百度百科]

KnowBert

KAR

关键思想

关键思想:在输入文本中显式建模实体跨度(Entity spans),并使用实体链接器(Entity Linker)从KB中检测mention、检索相关的实体嵌入(Entity embeddings),以形成知识增强的实体跨度表示形式。然后使用word-to-entity attention将单词的表示重新上下文化,以携带全部的实体信息。

优点
  1. 不针对特定任务,可以fine-tune
  2. 轻量,增加了少量的参数和运行时间
  3. 便于融合其他KB
方法
1、他人工作:从KB中检测mention、检索相关的实体嵌入(Entity embeddings)

输入:文本
输出:候选实体列表 C C C与之对应的先验概率
例: Prince sang Purple Rain, she …
[Prince] sang [Purple [Rain]],[she]…

在这里插入图片描述
检测mention的方法是2017年的共指消解文章中提及的方法,这里就不展开介绍了,作者也是拿来直接用。2017年的文章做了这两个事情,1、mention检测。2、共指消解。举个例子,输入文本Prince sang Purple Rain, she …,通过mention检测可以获得[Prince] sang [Purple [Rain]],[she],这几个mention,然而这句话当中,Prince和she共同指代同一个实体,那在传统的embedding方式中这个Prince和she的编码可能不太一致,共指消解的目的就是消除这样的不一致。
至于检索相关的实体,作者使用的是基于规则的方式,也是前人的工作。
Entity embeddings呢,对于不同的数据库作者的做法不完全一致,作者使用三类数据库中的知识,对于图结构的数据库,作者使用了2019年知识图谱embedding的最新工作获得实体嵌入,对于仅有实体元数据的数据库,作者在实验部分介绍到他们使用doc2vec的方式直接从Wikipedia描述中学习Wikipedia页面标题的300维嵌入。两种融合在一起的数据库作者也介绍了他们使用的方法。
总之,在本文中,输入一段文本,作者可以检测其中的mention,检索获得对应的Entity Embedding列表,同时也获得实体对应的先验概率。这些是不参与训练的。

KAR

在这里插入图片描述
KAR插入在BERT层间, H i H_i Hi

  • 6
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
增强的switch语句是一种替代传统switch语句的语法糖。它具有返回值的能力,可以将整个语句作为一个表达式,在不同的情况下返回不同的值,而不仅仅是执行不同的语句。\[2\]增强的switch语句使用箭头来合并不同的case,之间以逗号分隔。这样可以减少代码的冗余。\[1\]同时,增强的switch语句要求在所有的情况下都有返回值,因此需要涵盖所有可能的情况。\[2\]在增强的switch语句中,标签可以是byte、short、int、char和String类型的常量表达式。多个标签可以合并,用逗号分隔。\[3\]每个标签中的语句部分可以是一条语句,也可以是用大括号包裹的一个块。\[3\]在执行增强的switch语句时,会按顺序匹配标签,进入第一个与标签相匹配的case执行。如果在某个case执行后没有使用break语句,将会顺序执行下面的case,而不再进行匹配。\[3\] #### 引用[.reference_title] - *1* [Switch statement can be replaced with enhanced ‘switch](https://blog.csdn.net/UZDW_/article/details/108913584)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [java 普通switch与增强型switch](https://blog.csdn.net/qq_39631640/article/details/113897410)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值