c++与libtorch混合编程:std:runtime_error及c10:error报错分析

模型文件pt转换要点

pth转换成pt文件时,尽量用cuda转换,即

input_tensor.cuda()
#模型输入张量放在gpu上
model.cuda()
#模型放在gpu上

因为用gpu转换后的模型文件,在c++中可以在cpu上进行预测也可以在gpu上进行预测,而用cpu转换后的pt模型,在c++中只能用cpu预测

在c++中,device=torch::kCPU时,报错分析

报错图片
经过对c++代码的拆分

//在torch::kCPU
auto outputs = module.forward(input);
auto tu_outputs = outputs.toTuple();

发现module.forward(input)运行通过,报错在下一句,即outputs.toTuple()。类型转换时报错,报错原因可能在python中的模型返回值上。
首先,如果你的模型返回一个值,可以用toTensor()去转换。
我的python模型返回值是

return [x2,x8,x10]

一个list,这就是报错原因,把python代码改成

return (x2,x8,x10)

返回值类型是一个tuple,此时c++中可以用.toTuple()进行类型转换。或者不改变python代码,c++用.toList()进行转换。问题得以解决,再运行,成功通过。

在c++中,device=torch::kCUDA时,报错分析

在forward()时,std::runtime_error
在这里插入图片描述

首先 在c++中判断cuda是否可以使用

cout << "cuda是否可用:" << torch::cuda::is_available() << endl;
cout <<"cudnn是否可用:" <<torch::cuda::cudnn_is_available() << endl;

如果是Ture(1),则cuda可以使用,如果为False(0),cuda不可以使用,我当时就是cuda不能使用,但是在python中cuda可以使用,是c++运行环境配置问题。
解决方法:
项目右键->属性->链接器->命令行->其他选项输入->/INCLUDE:?warp_size@cuda@at@@YAHXZ
在这里插入图片描述
问题得以解决,cuda为ture(1)
第二步 判断模型及数据是否放到了cuda上

device = torch::kCUDA;
try
{
	module = torch::jit::load(modelPath, device);
}
catch (const c10::Error& e)
{
	std::cerr << "Error\n";
}

如果抛出错误,要么模型路径不对,要么没有用cuda加载

cout << "photo的device:" << photo.device() << endl;

判断数据是否在cuda上,通过检测发现模型和数据均位于cuda上,排除此出错原因

第三步 排除libtorch版本原因,libtorch有cpu版本和cuda版本,cuda版本可以在cuda和cpu上使用,cpu版本只能在cpu上使用,因为我曾经用c++在gpu上预测过模型,所以确定版本是cuda版本,排除此错误。

第四步 排除超出显存原因 可以用两种方式排除
建议在c++代码中加入torch::NoGradGuard no_grad;可以预防梯度计算,减小显存

input.emplace_back(photo);	
torch::NoGradGuard no_grad;
auto outputs = module.forward(input).toTuple();
//放在前向传播语句前,input.emplace_back(photo);语句后

1.在此电脑上用batch_size=1,在cuda上进行训练,不报错,排除超出显存原因
2.打开任务管理器,在c++运行时查看gpu占用情况,可以确定显存是否够用。
在这里插入图片描述
第五步 排除网络结构及转换问题
因为在cpu中forward()是通过运行的,所以确定网络结构及转换是没有问题的

第六步 因为排除了cuda,libtorch,网络等以上问题,所以猜测问题可能出现在cuda与libtorch交接上,即cuda与libtorch版本不对应,所以交接出现问题。通过替换cuda版本,std::runtime_error问题得以解决。

运行通过
在这里插入图片描述

这就是我排除掉的错误及排除错误的思路,希望对大家有所帮助。

  • 29
    点赞
  • 81
    收藏
    觉得还不错? 一键收藏
  • 47
    评论
### 回答1: std::runtime_errorC++标准库中的一个异常类,用于在程序运行时抛出异常。通常情况下,std::runtime_error是由程序员主动抛出的,以表明程序遇到了无法处理的错误或异常情况,需要终止程序运行并抛出异常信息。这个异常类通常被用于表示一些预期的错误情况,比如文件读取失败、内存分配失败等。当程序抛出std::runtime_error异常时,可以通过try-catch语句捕获并处理该异常,以保证程序的稳定性和可靠性。 ### 回答2: std::runtime_errorC++标准库中的异常类,属于exception头文件中定义的一类异常。它被设计用来表示运行时错误,也就是在程序执行的过程中出现的错误。 当程序在运行时遇到无法处理的错误时,可以使用std::runtime_error来抛出一个异常。例如,在处理文件时,如果发现该文件不存在,你可以通过抛出std::runtime_error异常来告诉程序出现了运行时错误。 std::runtime_error通常用于在程序运行时检测到的错误,比如发生了除以零的错误、试图访问不存在的内存位置、网络连接断开等。在这些情况下,程序需要停止当前操作并通知用户或者其他程序员发生了错误。 如果你开发一个库或者框架,你可以在你的代码中使用std::runtime_error来表示你的库或框架在执行某个操作时遇到了无法处理的错误。当其他程序员使用你的库时,他们可以捕获这个异常来处理错误。 总的来说,std::runtime_errorC++中是一个非常常用的异常类,它可以帮助我们检测和处理运行时错误,使得程序变得更加健壮和可靠。 ### 回答3: std::runtime_errorC++ 标准库中的一个异常类,用于表示运行时错误。 异常是指在程序运行过程中发生的一些不符合预期的情况,导致程序无法正常完成执行的情况。当程序遇到异常情况时,可以通过异常处理机制来捕获异常并处理它,以保证程序的稳定和正确性。 std::runtime_error 定义在 <stdexcept> 头文件中,是 std::exception 的一个派生类。它用于表示一些与程序执行相关的错误,例如: - 程序试图访问越界的数组元素; - 程序试图打开不存在的文件; - 程序试图执行无效的操作等。 当这些错误发生时,可以抛出一个 std::runtime_error 异常,通知调用者出现了错误并提供错误信息。例如: ```c++ // 打开一个文件并读取其中的内容 std::ifstream ifs("file.txt"); if (!ifs) { throw std::runtime_error("Failed to open file.txt."); } // 从文件中读取一行 std::string line; if (!getline(ifs, line)) { throw std::runtime_error("Failed to read from file.txt."); } ``` 在上面的代码中,如果文件打开失败或读取文件内容失败,将抛出一个 std::runtime_error 异常并指定相应的错误信息。调用者可以通过 try-catch 块来捕获并处理该异常,以避免程序崩溃或产生一些不可预测的结果。 总的来说,std::runtime_errorC++ 异常处理机制中一个非常有用的异常类,可以用于表示程序运行时的各种错误情况,并提供相应的错误信息。了解和正确使用它可以提高程序的健壮性和可靠性。
评论 47
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值