GPU运维
文章平均质量分 71
SchopenhauerZhang
/*
以往: 十字路口 瑟瑟发抖
而如今:吾常身不离鞍,髀肉皆消。今不复骑,髀里肉生。
*/
我到了该读王小波的作品的阶段了
展开
-
DLRover 部署指南之5分钟上手分布式模型训练,让你体验别样人生
这里逻辑目前看来似乎存在bug,如果旧节点长时间Err status,DLRover并不会主动清理,但是会拉起新的节点(因为组网最小集合不满足),于是发生失败的节点越多,新加入的节点越多,节点越多,失败的概率增大;仅安装基础CRDs,也是测试DLRover后续需要使用到的elasticjobs.elastic.iml.github.io和scaleplans.elastic.iml.github.io;前往https://golang.google.cn/dl/ 下载对应的版本包;原创 2024-01-16 23:50:48 · 1516 阅读 · 2 评论 -
扩容逻辑卷LVM流程
可以通过命令 lvdisplay /dev/mapper/ubuntu–vg-ubuntu–lv 查看发现由89G->890G;通过vgs、lvdisplay确定vg组信息;确认逻辑卷所在组正常,否则需要手动将lvm加入vg组管理;确定挂载点,确定可扩容大小(比如本例 89G->890.7G)确定文件系统类型,这里可以通过type字段知道是ext4;确定文件系统类型,这里可以通过type字段知道是ext4;但是df -Th 查看发现文件系统大小仍然没变;因为这里是ext4,所以。原创 2024-01-09 18:21:13 · 339 阅读 · 0 评论