NER任务的一点疑惑

1.句子分类任务
句子分类等任务是将整个句子输入到编码器获取句子编码,根据句子编码通过softmax函数获取该句子属于某一类别的概率,最大的概率值所对应的标签为该句子的类别
2.NER任务
与句子分类任务不同的是NER任务需要获取句子中每个词的标签,由于这一点的不同,最开始纠结于NER任务的输入数据到底是什么,是整个句子还是逐个字或者单词,但是LSTM等编码器会获取句子上下文信息,因此不可能逐个输入单个字或者单个单词,这样没有意义,但是如果输入是整个句子最后得到的是句子的编码信息,又该如何获取每个字或者单词的编码,从而根据单个字或者单词的编码,通过softmax函数获取标签呢??

3.个人疑惑解答
最终了解到在LSTM输出时包括两个值,
, = self.lstm()
序列值和最后一个神经单元的值,其中序列值中的每一个值代表所输入句子的每个字或者单词的编码,最后一个神经单元的值代表整个句子的编码,即上式等号左边的两个占位符分别代表上述两个值。

4.举例说明:
batch-size值为1,句子长度为10,词向量维度为300,LSTM隐藏层维度为200,则经过LSTM计算以后序列值维度为[1,10,200],其代表有10个200维的向量,其中每一个向量代表句子中每一个词的编码;最后一个神经元的输出值维度为[1,200],即句子编码

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值