- 博客(11)
- 收藏
- 关注
原创 实践:将cuda代码转化成hip代码,并编写为pytorch的extension
no-offload-arch=gfx1030 表示不对gfx1030进行编译,rocwmma不支持gfx1030,编译gfx1030会报错。将head_dim 修改为 64。这是因为之前将warp_size设置成64后,一个block的总线程数会超过1024。难点:fused-attention 使用了wmma,如何让这种调库的代码编写为pytorch的extension。并且让转化后的hip代码也能编写为pytorch的extension。可能会出现out of memory 的错误,不要紧张。
2023-09-11 23:17:40 583
原创 hip程序随手可加的小优化
下面所说的优化,不会有质变的效果。但是,节省的一点点时间也会产生较大的加速比。而且很方便添加,在写kernel时可以随手加上。
2023-09-11 22:21:25 119
原创 使用mock的量子计算机解决真实量子计算机位数不够问题
问题描述:这几天在做量子计算毕设的时候, 发现IBM的开放账户, 只能使用5比特的量子计算机. 这对做研究有很大的阻碍, 在网上没有找到其他更好的提供真实量子计算机的平台.之后发现可以使用qiskit中的test.mock去模拟真实量子计算机.解决方案:qiskit.test.mock 可以模拟IBM中无法使用的真实量子计算机.它的原理是将真实量子计算机的参数放入模拟计算机中.在qiskit中没有详细的文档, 但是通过代码可以找到相应的信息,下面是几个与IBM对应的模拟计算机:FakeArmo
2022-04-08 10:30:40 127
原创 git 本地分支和远程分支相关联的操作
查看所有分支(本地加远程)git branch -a结果如下:devmasterremotes/origin/HEAD -> origin/masterremotes/origin/devremotes/origin/master其中 HEAD 是指针指向当前活跃的分支如果远程创建了一个分支,本地没有进行过任何操作时, 使用 git branch -a 是看不到那个分支git checkout -b <分支名>如果分支不存在就创建该分支, 并跳转到该分支如果分支
2020-05-31 21:54:11 452
原创 对微信API整体的promise封装 和 对promise写法的一些反思
对微信API整体的promise封装 和 对promise写法的一些反思promise 一直号称是解决回调地狱的最好方法, 但是对于他我们应该怎么使用呢之前在写小程序 写的非常的别扭:new Promise((resolve, reject) => { wx.login({ success (res) { console.log(res) const {code} = res resolve(code)
2020-05-22 17:17:29 281
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人