KeyError: ‘Transformer/encoderblock_0\\MultiHeadDotProductAttention_1/query\\bias is not a file in t

最新推荐文章于 2024-07-25 18:25:30 发布

郑小路

最新推荐文章于 2024-07-25 18:25:30 发布

阅读量693

点赞数 12

分类专栏： BUG解决文章标签： transformer 深度学习人工智能

本文链接：https://blog.csdn.net/yitiaoxiaolu/article/details/136330017

版权

BUG解决专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文讲述了在Windows系统中运行GitHub上的VIT模型时遇到的路径错误，原因是不同操作系统对路径分隔符的处理不同。文章提供了修改modeling.py和modeling_resnet.py中路径字符串的方法，以确保在Windows环境下正确加载模型权重。

摘要由CSDN通过智能技术生成

在运行Window系统中运行GitHub上的VIT时出现如下报错
报错：
KeyError:‘Transformer/encoderblock_0\MultiHeadDotProductAttention_1/query\kernel is not a file in the archive’

出错原因：
pjoin(ROOT, ATTENTION_Q, “kernel”)将多个路径组合为一个路径出错

pjoin（）函数在Windows下，路径分隔符是反斜杠\，而在Unix和Linux下，路径分隔符是正斜杠/

问题描述

KeyError: 'Transformer/encoderblock_0\\MultiHeadDotProductAttention_1/query\\bias is not a file in the archive'

这个错误主要由字符串地址拼接时Windows和Linux等其他系统不太一样，Windows使用 \ 符号，所以找到字符串拼接的地方加上 / 即可

解决方案：

1、modeling.py的相应行加上/

ATTENTION_Q = "MultiHeadDotProductAttention_1/query/"
ATTENTION_K = "MultiHeadDotProductAttention_1/key/"
ATTENTION_V = "MultiHeadDotProductAttention_1/value/"
ATTENTION_OUT = "MultiHeadDotProductAttention_1/out/"
FC_0 = "MlpBlock_3/Dense_0/"
FC_1 = "MlpBlock_3/Dense_1/"
ATTENTION_NORM = "LayerNorm_0/"
MLP_NORM = "LayerNorm_2/"

2、modeling.py的load_from函数加/

def load_from(self, weights, n_block):
    ROOT = f"Transformer/encoderblock_{n_block}/"

3、modeling_resnet.py修改：

self.body = nn.Sequential(OrderedDict([
    ('block1/', nn.Sequential(OrderedDict(
        [('unit1/', PreActBottleneck(cin=width, cout=width*4, cmid=width))] +
        [(f'unit{i:d}/', PreActBottleneck(cin=width*4, cout=width*4, cmid=width)) for i in range(2, block_units[0] + 1)],
        ))),
    ('block2/', nn.Sequential(OrderedDict(
        [('unit1/', PreActBottleneck(cin=width*4, cout=width*8, cmid=width*2, stride=2))] +
        [(f'unit{i:d}/', PreActBottleneck(cin=width*8, cout=width*8, cmid=width*2)) for i in range(2, block_units[1] + 1)],
        ))),    
    ('block3/', nn.Sequential(OrderedDict(
        [('unit1/', PreActBottleneck(cin=width*8, cout=width*16, cmid=width*4, stride=2))] +
        [(f'unit{i:d}/', PreActBottleneck(cin=width*16, cout=width*16, cmid=width*4)) for i in range(2, block_units[2] + 1)],
        ))),
]))

亲测有效！顺利进入到数据集下载部分。
在这里插入图片描述

郑小路

关注

12
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
KeyError: ‘Transformer/encoderblock_0\\MultiHeadDotProductAttention_1/query\\bias is not a file in t

Transformer/encoderblock_0\\MultiHeadDotProductAttention_1/query\\kernel is not a file in the archive'
复制链接

扫一扫

专栏目录