【小白踩坑】tensorboardX --Did you forget call .eval() on your model?

使用tensorboardX 的SummaryWriter进行writer保存网络过程中遇到错误。

报错信息

TracerWarning: Trace had nondeterministic nodes. Did you forget call .eval() on your model? Nodes:
	%x.3 : Float(16, 16, 500, 1, strides=[8000, 500, 1, 1], requires_grad=1, device=cpu) = aten::dropout(%263, %88, %89) # C:\Users\lenovo\.conda\envs\EEGnet\lib\site-packages\torch\nn\functional.py:1266:0
	%input.17 : Float(16, 4, 16, 500, strides=[32000, 1, 2000, 4], requires_grad=1, device=cpu) = aten::dropout(%266, %133, %134) # C:\Users\lenovo\.conda\envs\EEGnet\lib\site-packages\torch\nn\functional.py:1266:0
	%input.29 : Float(16, 4, 4, 125, strides=[2000, 1, 500, 4], requires_grad=1, device=cpu) = aten::dropout(%270, %186, %187) # C:\Users\lenovo\.conda\envs\EEGnet\lib\site-packages\torch\nn\functional.py:1266:0
This may cause errors in trace checking. To disable trace checking, pass check_trace=False to torch.jit.trace()
  _check_trace(
C:\Users\lenovo\.conda\envs\EEGnet\lib\site-packages\torch\jit\_trace.py:1093: TracerWarning: Output nr 1. of the traced function does not match the corresponding output of the Python function. Detailed error:
Tensor-likes are not close!

Mismatched elements: 16 / 16 (100.0%)
Greatest absolute difference: 0.05825650691986084 at index (1, 0) (up to 1e-05 allowed)
Greatest relative difference: 0.1222612684738262 at index (15, 0) (up to 1e-05 allowed)
  _check_trace(

提炼出重点:

 Trace had nondeterministic nodes. Did you forget call .eval() on your model? 

解决方法

  1. 排查对应出错代码为:
writer.add_graph(net, (inputs,))
  1. 整体代码:
 writer = SummaryWriter('./Result')
    # 训练 循环
    for epoch in range(200):
        print("\nEpoch ", epoch)

        running_loss = 0.0
        for i in range(len(X_train) // batch_size - 1):
            s = i * batch_size
            e = i * batch_size + batch_size

            inputs = torch.from_numpy(X_train[s:e])
            labels = torch.FloatTensor(np.array([y_train[s:e]]).T * 1.0)

            # wrap them in Variable
            inputs, labels = Variable(inputs), Variable(labels)

            # zero the parameter gradients
            optimizer.zero_grad()

            # forward + backward + optimize
            outputs = net(inputs)
            loss = criterion(outputs, labels)
            loss.backward()

            optimizer.step()

            running_loss += loss.item()
            # if i == 1:
            #     with SummaryWriter(comment='Net') as w:
            #         w.add_graph(net, (inputs,))

        # 验证
        params = ["acc", "auc", "fmeasure"]
        print(params)
        print("Training Loss ", running_loss)
        train_acc, train_auc, train_fmeasure = evaluate(net, X_train, y_train, params)
        print("Train - ", train_acc, train_auc, train_fmeasure)
        val_acc, val_auc, val_fmeasure = evaluate(net, X_train, y_train, params)
        print("Valvidation - ", val_acc, val_auc, val_fmeasure)
        test_acc, test_auc, test_fmeasure = evaluate(net, X_train, y_train, params)
        print("Test - ", test_acc, test_auc, test_fmeasure)
        # net.eval()
        writer.add_graph(net, (inputs,))
        tags = ["data/train_val_acc", "data/train_val_acc", "data/train_test_acc"]  # 绘图的tags
        writer.add_scalars(tags[1], {'trainACC': train_acc, 'valACC': val_acc, 'testACC':test_acc}, epoch)  # 绘制train和val的accuracy,放在一个图上
        writer.add_scalar(tags[2], optimizer.param_groups[0]["lr"], epoch)  # 绘制学习率曲线,放在一个图上
  1. 分析发现,问题在于add_graph(net, (inputs,))应在训练完成后,而不应该再epoch迭代中就保存。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 这是一条使用 Python 脚本进行目标检测评估的命令。该命令使用了一个名为 eval_rcnn.py 的 Python 脚本,并传入了三个参数: 1. --cfg_file:表示使用的配置文件,默认为 cfgs/default.yaml; 2. --eval_mode:表示评估模式,此处为 rcnn,表示使用 RCNN 模型进行评估; 3. --eval_all:表示评估全部数据集,即对所有图像进行评估。 这个命令的具体作用是评估 RCNN 模型在指定数据集上的目标检测性能,并输出评估结果。 ### 回答2: 这条命令是用于在Python中执行一个名为eval_rcnn.py的脚本。它使用了三个指定参数: 1. --cfg_file:指定要使用的配置文件,默认为cfgs/default.yaml。配置文件通常包含了一些模型的设置,如网络结构、训练参数、数据集路径等。 2. --eval_mode:指定评估模式为rcnn,其中"rcnn"通常表示使用R-CNN(Region Proposal Network-Convolutional Neural Network)算法进行目标检测。 3. --eval_all:表示对所有样本进行评估,而不仅仅是某个子集。这是一种在测试阶段进行全面评估的常见做法,以评估模型在整个数据集上的性能。 综上所述,该条命令的目的是在Python环境中运行一个名为eval_rcnn.py的脚本,使用指定的配置文件(cfgs/default.yaml)对R-CNN算法进行目标检测,并对整个数据集进行评估。 ### 回答3: 这个命令是用于在 Python 中运行 eval_rcnn.py 脚本,它的参数含义如下: --cfg_file cfgs/default.yaml:指定配置文件为 cfgs/default.yaml。配置文件是用来设置模型的超参数和其他相关参数的文件,这里使用的是 default.yaml 文件。 --eval_mode rcnn:设置评估模式为 rcnn。这表示模型会根据预训练的 RCNN 算法进行评估。 --eval_all:这个参数用来进行全面评估。它会评估模型在数据集中的所有样本上的性能,而不仅仅是某个特定的子集。通常在训练完成后,使用该参数来对模型进行全面评估,以得到一个更全面的性能指标。 总之,这个命令会使用指定的模型配置文件和评估模式,在所有的数据样本上对模型进行评估,并输出评估结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值