CRF维度问题

最新推荐文章于 2022-06-23 11:45:41 发布

comeonfly666

最新推荐文章于 2022-06-23 11:45:41 发布

阅读量300

点赞数 1

分类专栏： NLP 文章标签：深度学习 pytorch 人工智能

本文链接：https://blog.csdn.net/comeonfly666/article/details/121193826

版权

NLP 专栏收录该内容

8 篇文章 1 订阅

订阅专栏

在学习BiLSTM+CRF进行NER任务时，处理样本数据遇到维度问题，参考GitHub代码后解决，以计算正确实例的路径分数为例

$all\_scores: (batch\_size, length, label\_size, label\_size)$

$all\_scores[i][j][k][m]$ 表示第 $i$ 个样本，第 $j$ 个位置，由 $l a b e l [k] （上一个）$ 转移为 $l a b e l [m] （当前标签）$ 的转移分数与发射分数之和。

$tags : (batch\_size, length)$

# tag_gather (batch_size, length, label_size, 1)
tag_gather = tags.view(batchSize, sentLength, 1, 1).expand(batchSize, sentLength, self.label_size, 1) 
# currentTagScores[i][j][k][0] = all_scores[i][j][k][tag_gather[i][j][k][0]]
# currentTagScores 表示表示第i个样本，第j个位置上，所有label到正确tag的概率
currentTagScores = torch.gather(all_scores, 3, tag_gather).view(batchSize, -1, self.label_size)

注意 $tag\_gather[i][j][k]$ 对于任意 $k$ 都相同，都是第 $i$ 个样本中第 $j$ 个位置的标签。

# 第0个位置 由[start]到当前tag的分数
tagTransScoresBegin = currentTagScores[:, 0, self.start_idx]
# 计算中间位置的分数
tag_middle_gather = tags[:, : sentLength - 1].view(batchSize, sentLength - 1, 1)
# tagTransScoresMiddle[i][j][0] = currentTagScores[i][j][tag_middle_gather[i][j][0]]
# tagTransScoresMiddle 表示第i个样本，第j个位置的分数
tagTransScoresMiddle = torch.gather(currentTagScores[:, 1:, :], 2, tag_middle_gather).view(batchSize, -1)

最后利用masked_select函数求得相应长度的分数。

score += torch.sum(tagTransScoresMiddle.masked_select(masks[:, 1:]))

comeonfly666

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录