Transformer的各个模块 Inputs在字典中找到对应的嵌入表示(batchsize*seqlen*model_dim)词嵌入矩阵需要根据语料库来确定第一个维度(字典里面有多少个词)定义Input Embedding层我们现在确定了字典里面有1000个词;此时batchsize*seqlen*model_dim=2*4*512。
pycharm断点调试 3.如果运行到某一行,你想要观察这一行的代码调用的函数中,各种变量都发生了什么变化,则step into 就跳转到我所引用的函数里面去,如果函数中存在子函数,那么不会显示子函数变量的信息,会将子函数执行完以后再返回变量的信息。2.接下来适用step over键,可以逐行运行,观察每一行的代码中数据都发生了什么。5.如果想要跳出函数的话step out。1.设置断点,代码运行到第105行停止。4.接着使用step over逐行跳转。