CUSP中报错xxx_matrix fill-in would exceed maximum tolerance

小锋学长生活大爆炸

已于 2022-06-21 17:07:48 修改

阅读量1.5w

点赞数

分类专栏：学习之旅文章标签：矩阵线性代数稀疏矩阵 cuda cusp

于 2022-06-18 16:21:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sxf1061700625/article/details/125348321

版权

学习之旅专栏收录该内容

186 篇文章 52 订阅

订阅专栏

目录

情景复现

在调用cusp::io::read_matrix_market_file和cusp::convert函数对dia或ell格式的稀疏矩阵进行操作的时候，都可能会出现这个问题。

报错原因

其实就是转换后的dia、ell等格式的矩阵太大了，报错提示你可能会把内存耗完。

但话说回来，现在N显卡动不动20+G的内存，一个8M的矩阵，不至于会把他耗完吧？

看到CUSP最新的0.6版本也只是在2016年发布，我估计在那时候显卡还没这么发达。而且通过nvidia-smi -lms动态查看显卡调用，发现才用了250M内存啊。所以应该是代码里进行了限制。

解决方法

通过一步一步断点调试跟踪，最终发现，在这个地方进行了限制：

源码路径：cusp\system\detail\generic\conversions

先以coo_to_other.h来看：

（以read_matrix_market_file函数为例，convert函数可以照此调试跟踪。实际read_matrix_market_file内部也调用了convert）

可以发现，threshold被设置了1000000(1百万)个entries(元素)，而我们的矩阵高达70000000(7千万)个元素。

前面的fill_ratio也不知道啥意思，但它的if用的是&&(与)，那简单粗暴，直接把threshold改大试试(我改成了1e10)...

改完发现确实成功了，我这低端的MX150显卡都能存7千万个元素，那说明改大也没啥大问题。

最后说明

1、主要我在CUSP的github和网上都没搜索到相应的解决方案，所以这里私自更改源码调大threshold，大家仅供参考。如果大家有更好的方法，欢迎留言评论~~

2、如果要改threshold，视实际使用情况，记得把目录下其他相关文件的threshold也改了。

3、记得改完后，重新nvcc编译哦。

4、注意不要改太大，容易报错喔。大矩阵一般要用如因式分解等其他方法计算，只改源码是不行的喔。

CUSP官方文档：CUSP: Main Page (cusplibrary.github.io)

小锋学长生活大爆炸

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
CUSP中报错xxx_matrix fill-in would exceed maximum tolerance

关于CUSP中无法读取大矩阵的解决方法
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小锋学长生活大爆炸 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。