ubuntu
文章平均质量分 74
ERROR_LESS
给岁月以文明,而不是给文明以岁月!
展开
-
ubuntu删除snap和log文件解决var区空间不足的问题
最近突然系统跳出var区空间不足的提示,这往往是因为装双系统的时候分配的空间不够。通过查询可以发现,一般是snap文件和log文件的原因,而这些文件大多无用却占用很大空间,因此可考虑删除。第1步: 进入文件所在位置第2步:查看文件版本的可用性可见很多disable的版本,即可删掉第3步:直接删除相应文件(像很多使用指令的教程并不管用)删除log文件直接进入对应目录,删除相应文件...原创 2022-07-05 16:07:09 · 8430 阅读 · 4 评论 -
如何选用GPU云服务器?
相关参数:地域、计费方式、CPU、内存、带宽、系统盘、数据盘就近原则,理论上,用户距离云服务器地域越近,网络延迟越低,速度越快。当需要部署大型项目涉及负载均衡和高并发量等时,地域节点的影响会慢慢凸显。包年包月:一般适用于24小时在线服务(无特殊需求则选择这个方案,性价比高)按量计费:间歇使用CPU是服务器的一个核心,表示云服务器的运算能力。............原创 2022-06-24 16:51:36 · 1178 阅读 · 0 评论 -
ubuntu下复制/删除/解压缩文件和文件夹
此篇博客仅作为记录~原创 2022-06-19 13:58:56 · 1306 阅读 · 0 评论 -
Tensorflow ParameterServerStrategy Training知识学习记录
前面部分很多只是笔者学习知识记录的部分并且会随着学习的深入不段增加知识,没有什么参考价值,实战部分或许更有借鉴意义。官方文档参考学习到的知识及需要学习的知识:异步训练支持keras高阶API和自定义训练(实验需要,目前只学习keras)和两个概念需要明确集群中的三个角色的分工需要了解:、、是什么?为什么需要这个东西?是什么?为什么需要这个东西?评估如何实现?官方示例需要创建2个ps服务器和3个worker服务器每个worker上支持调用多个GPU但需要保证所有worker上的GPU数目是一致的。成为分片,原创 2022-06-17 20:16:19 · 267 阅读 · 0 评论 -
Kubeflow第一篇--大致了解
本篇博客本义作为笔者记录所用,所以可能稍显冗长,但同时也记录了我的学习研究思路,可供读者借鉴,能对大家有些许帮助就是笔者最为开心之事~kubefolw 是一个专门为kubernetes定制的机器学习工具包。Kubeflow Pipelines是一个基于Docker容器进行创建、部署、管理多步ML 工作流的平台。Kubeflow 提供很多组件进行跨多个平台机器学习训练。Kubeflow UIs提供了一个快速访问安装在kuber原创 2022-04-24 18:24:29 · 3191 阅读 · 0 评论 -
multi_worker分布式tensorflow训练出现的问题
1 版本不适配问题预装的tensorflow版本是1.0+版本不够,最后选的2.6版本cuda是11.5keras也是2.6numpy是1.192 查看不到cuda和cudnn原指令是:# 查看cudacat /usr/local/cuda/version.txt# 查看cudnncat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2因最新版本的version.txt和 cudnn.h文件均不存在了故最新指令是:#原创 2022-03-28 13:50:02 · 2417 阅读 · 1 评论 -
因linux内核过高以至于nvidia驱动不匹配
ubuntu内核版本和nvidia驱动适配问题【已解决】原创 2022-03-25 11:57:32 · 11298 阅读 · 1 评论