ROCm上来自Transformers的双向编码器表示（BERT）

最新推荐文章于 2024-07-01 06:05:40 发布

109702008

最新推荐文章于 2024-07-01 06:05:40 发布

阅读量873

点赞数 26

分类专栏： # python 人工智能 # 深度学习文章标签： bert 人工智能深度学习

本文链接：https://blog.csdn.net/eidolon_foot/article/details/138971832

版权

python 同时被 3 个专栏收录

125 篇文章 0 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

深度学习

80 篇文章 0 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

人工智能

227 篇文章 3 订阅

订阅专栏

14.8. 来自Transformers的双向编码器表示（BERT） — 动手学深度学习 2.0.0 documentation (d2l.ai)

代码

import torch
from torch import nn
from d2l import torch as d2l

#@save
def get_tokens_and_segments(tokens_a, tokens_b=None):
    """获取输入序列的词元及其片段索引"""
    tokens = ['<cls>'] + tokens_a + ['<sep>']
    # 0和1分别标记片段A和B
    segments = [0] * (len(tokens_a) + 2)
    if tokens_b is not None:
        tokens += tokens_b + ['<sep>']
        segments += [1] * (len(tokens_b) + 1)
    return tokens, segments

#@save
class BERTEncoder(nn.Module):
    """BERT编码器"""
    def __init__(self, vocab_size, num_hiddens, norm_s

了解本专栏

超级会员免费看

109702008

关注

26
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
ROCm上来自Transformers的双向编码器表示（BERT）

需要注意的是，这个代码片段作为一个解析，但实际中运行它需要额外的上下文（例如 MaskLM 类的实现）和适当的数据准备和预处理步骤。9. 模型实例化后，通过随机生成的 tokens 和 segments 调用其 forward 方法，得到编码后的向量 encoded_X，同时执行MLM和NSP任务，输出预测结果。6. MaskLM 类未在代码中定义，通常用来实现BERT的掩码语言模型任务，它在一定比例的输入词元上应用掩码，并训练模型来预测这些被掩码的词元。
复制链接

扫一扫