- 博客(4)
- 收藏
- 关注
原创 Linux PCIe to Nvme crash SMMU/IOMMU
在做大文件读取时,NVME把smmu弄崩溃了。FAR和PAR都是0,说明非法地址IOVA做映射时触发了SMMU映射失败。原因是Stream id 为0x1c81的NVME误改了DMA地址, nvme/host/pci.c 中的nr_io_queues=1就避免了崩溃。对TAGS维护很乱。
2023-09-04 19:39:02 282 1
原创 使用GPU 训练DeepSpeech tensorflow遇到的问题
在训练是steps增长速度很忙,nvidia-smi命令查看GPU内存几乎没用,买的是新的显卡RTX3060, 这个显卡采用的最新的是ampere架构, CUDA必须是11.x, cuDNN必须是8.x。然而deepsleep 仍用tensorflow==1.15.4,没有对应的cuda, cudnn的版本, 出现下面错误。tensorflow.python.framework.errors_impl.InvalidArgumentError: No OpKernel was registered t.
2021-07-26 11:50:59 1006
原创 使用pytorch GPU训练YOLOv5遇到的坑
1. import torchtorch.cuda.is_available() 返回False, 发现需要使用torch对应的GPU版本:https://download.pytorch.org/whl/torch_stable.html 查看版本:import torch torch.__version__import torchvisiontorchvision.__version__...
2021-06-30 18:03:52 2726
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人