CUSP中报错xxx_matrix fill-in would exceed maximum tolerance

目录

情景复现

报错原因

解决方法

最后说明


情景复现

在调用cusp::io::read_matrix_market_filecusp::convert函数对diaell格式的稀疏矩阵进行操作的时候,都可能会出现这个问题。

报错原因

其实就是转换后的dia、ell等格式的矩阵太大了,报错提示你可能会把内存耗完。

但话说回来,现在N显卡动不动20+G的内存,一个8M的矩阵,不至于会把他耗完吧?

看到CUSP最新的0.6版本也只是在2016年发布,我估计在那时候显卡还没这么发达。而且通过nvidia-smi -lms动态查看显卡调用,发现才用了250M内存啊。所以应该是代码里进行了限制。

解决方法

通过一步一步断点调试跟踪,最终发现,在这个地方进行了限制:

源码路径:cusp\system\detail\generic\conversions

先以coo_to_other.h来看:

(以read_matrix_market_file函数为例,convert函数可以照此调试跟踪。实际read_matrix_market_file内部也调用了convert)

可以发现,threshold被设置了1000000(1百万)个entries(元素),而我们的矩阵高达70000000(7千万)个元素。

前面的fill_ratio也不知道啥意思,但它的if用的是&&(与),那简单粗暴,直接把threshold改大试试(我改成了1e10)...

改完发现确实成功了,我这低端的MX150显卡都能存7千万个元素,那说明改大也没啥大问题。

最后说明

1、主要我在CUSP的github和网上都没搜索到相应的解决方案,所以这里私自更改源码调大threshold,大家仅供参考。如果大家有更好的方法,欢迎留言评论~~

2、如果要改threshold,视实际使用情况,记得把目录下其他相关文件的threshold也改了。

3、记得改完后,重新nvcc编译哦。

4、注意不要改太大,容易报错喔。大矩阵一般要用如因式分解等其他方法计算,只改源码是不行的喔。

CUSP官方文档:CUSP: Main Page (cusplibrary.github.io)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小锋学长生活大爆炸

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值