NLP中<SOS>、<EOS>、<UNK>、<PAD>等标识符的含义

1.<SOS>、<BOS>、<GO>:代表一个序列的开始。

2.<EOS>:代表一个序列的结束,作为判断终止的标签。

3.<MASK>:用于遮盖句子中的一些单词。

4.<UNK>:未知字符,代表词典中没有的词。

5.<SEP>: 用于分隔两个输入句子,例如输入句子 A 和 B,要在句子 A,B 后面增加 <SEP> 标志。

6.<CLS> :放在句子的首位,表示句子的开始,就是classification的意思,通常会在bert等模型出现。

7.<PAD>:补全字符,例如要将句子处理为特定的长度,我们就要在句子前后补<PAD>。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值