【NLP】李宏毅老师ELMO, BERT, GPT讲解【笔记】

零、引例

首先来看一个例子,下面有四句话,每一句话中都有“bank”这个单词:
1、Have you paid that money to the bank yet ?
2、It is safest to deposit your money in the bank .

3、The victim was found lying dead on the river bank .
4、They stood on the river bank to fish.
但“bank”在其前两句话中的意思是“银行”,在后两句话中的意思是“河畔”。

在做word embeding的时候,我们当然希望“bank”这一种token能够有两种embeding结果。

Q:那我们能不能标记一词多义的形式呢?
A:不太现实,首先是词很多,而且“bank”也不止有2种意思,下面这句话:The hospital has its own blood bank.这里“bank”有人认为是第三种意思“库”,也有人认为是“银行”的延伸意思,所以也难界定到底有几种意思。

此时我们需要根据上下文来计算对应单词的embedding结果,这种技术称之为Contextualized Word Embedding

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值