11月9日,katago最新版本1.7.0推出。如同标题所言,此版本最大的改进,是对CUDA11.1的支持。通过版本升级,katago已经不止Opencl版本,CUDA版本也可以支持目前大火(缺货严重)的NVIDIA RTX 30** GPU。
虽然作者也提到新支持CUDA11.1版本在Tesla V100计算卡平台上,要慢于CUDA10.2版本(Beware though that on other GPUs CUDA 11.1 might not actually be faster than 10.2 - in one test on a V100 cloud machine, CUDA 11.1 seemed to be slower than CUDA 10.2.)。
但如同老黄在RTX30系列显卡发布会上的豪言:“20年后,我们再回首往事,会发现游戏从今天起腾飞。”
起飞的不止是游戏,还有深度学习等AI技术的应用。围棋AI也必须跟上技术飞速发展的步伐。
技术飞速发展时代,不进则退。
如同上一版本1.6一样,katago加速对新硬件、新软件的支持,对老硬件已经抛弃了。
家用gtx1660显卡,在1.7.0Opencl版本下,katago 40B权重的benchmark,还能达到82ELO。
到了1.6.1版本,Opencl版本下,katago 40B权重的benchmark,已经下滑到56-62ELO。
更不用提cuda版本可怜巴巴的40ELO.
在1.7.0Opencl版本下,情况略有改进,72ELO依然低于1.5.0版本。
看来显卡已经是必须更换了。
此外,腾讯云的GPU服务器,已经提供了cuda及cudnn的预安装,免去了手工安装的时间。但CUDA版本只是10.1,不用说katago的1.7版本,1.6版本都需要重新编译。如果使用opencl版本,性能差距不小,那运行时间比安装时间还要长。