CUDA的模板类里不要重载operator=

最新推荐文章于 2021-07-11 17:20:01 发布

cs199503

最新推荐文章于 2021-07-11 17:20:01 发布

阅读量218

点赞数

文章标签： python c/c++ 人工智能

苍天啊，这么一个问题折磨了我一天半。本来我有一个模板类：

template 
struct ALIGN16 foo
{
    T x[n];
    foo() {}
    foo(const foo& other) {...}

    void perator=(const foo& other) {...}
};

这个类在C++下没有任何问题，但在CUDA下却报出诡异的错误：

### Assertion failure at line 724 of ../../be/cg/NVISA/exp_loadstore.cxx:
### Compiler Error in file test_carray_gpu.cpp3.i during Code_Expansion phase:
### lda but not addr used?

感觉上，像是nvcc在deduce模板参数时出了问题，无法code expansion了。经过我坚持不懈的折腾，终于被我找到这个stupid的问题，那就是，不能重载operator=，因为我们的拷贝构造函数做了同样的事情，nvcc无法知道该调用那个函数，也可能是，在nvcc里，对象的拷贝和赋值只需要做到内存块的拷贝就可以了。总之，在你想重载operator=的时候，先考虑下，在GPU里，是否内存的直接拷贝就满足了这个需求呢？是否需要重载这个操作符呢？

唉，俺痛苦的一天，还好，没有无功而返。

原文

来自 “ ITPUB博客 ” ，链接：http://blog.itpub.net/22785983/viewspace-619793/，如需转载，请注明出处，否则将追究法律责任。

转载于:http://blog.itpub.net/22785983/viewspace-619793/

cs199503

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CUDA的模板类里不要重载operator=

苍天啊，这么一个问题折磨了我一天半。本来我有一个模板类：template struct ALIGN16 foo{ T x[n]; foo() {} foo(const foo& ot...
复制链接

扫一扫