- 博客(6)
- 资源 (2)
- 收藏
- 关注
原创 python加载数据集卡住 dmesg报错Nvidia xid31
在一次运维中发现客户加载数据集会卡住,物理机总共是4块显卡。使用k8s独占显卡进行任务训练,其中有三块显卡在跑任务训练加载数据集时卡住,同时查看dmesg报错 (xid 31)。[Tue Apr 13 09:45:31 2021] NVRM: Xid (PCI:0000:3b:00): 31, pid=3659, Ch 00000010, intr 00000000. MMU Fault: ENGINE GRAPHICS GPCCLIENT_GCC faulted @ 0x7fe1_d6f54000. F
2021-04-15 14:28:08 2662 3
原创 dind can‘t create unix socket /var/run/docker.sock
今天在k8s集群里看到了一个报错,在集群内存在一个容器docker in docker,发生了故障没有启动成功,查看日志显示 gateone-dind容器报错docker.sock应该是个文件,而在物理机的/apps/dind/run内确是个文件夹。在gateone-dind.yml写的需要将run文件夹挂载到容器内的·/var/run·,同时也把docker.sock挂载进入了pod容器内,所以会报错提示文件类型错误,只需要将宿主机/apps/dind/run内的docker.sock删除或者移走再重新
2021-03-02 11:01:18 695
原创 win10迁移C盘Administrator目录
因为在安装程序越来越多,使用时间越来越长,导致C:\Users\Administrator\AppData目录过大,C盘没有空间了,所以就需要清理,但AppData中记录的都是文件的缓存,比如聊天工具的记录、工具使用痕迹,甚至有的程序直接安装到此目录,所以不能直接删除,如果删除导致所有软件的记录都被删除。所以就有了下面的迁移操作。两种方法,第一种比较合适,第二种当做参考一、迁移目录,然后做软连接1.启动PE系统将C:\Users\Administrator迁移到新目录如D:\Users\Admin.
2021-02-23 10:34:43 6520
原创 nginx普通用户启动配置
nginx普通用户启动配置很多公司要求nginx不能用root用户启动,而普通用户不能监听80端口,所以要进行配置后才能正常运行nginx,以tq普通用户为例。其中redhat和ubuntu系统通过命令修改内核实现suse系统通过iptables端口转发实现一、RedHat和ubuntu系统1.编辑nignx配置文件#vi /etc/nginx/nginx.confworker_processes 1;user nginx tq; # 指定Nginx服务的用户ev
2020-07-01 11:18:21 4392
原创 在Docker容器中安装应用程序
**在Docker容器中安装vim**linux系统没有vim工具太不方便了,我要在docker容器里修改一些文件,所以决定安装下vim。系统是debian。首先进入容器(前提是容器已经启动):docker exec -it mysql bash # mysql是容器名称,换成你自己的接下来更新下apt-get的源。把下面的命令全部复制粘到容器的控制台执行:mv /etc/apt/sources.list /etc/apt/sources.list.bak && \
2020-07-01 11:09:51 3387 3
原创 Docker es集群 IP地址冲突报错 (filed to send join request to master)
docker IP地址冲突报错 (filed to send join request to master)# docker service logs $SEVICEID# docker exec -i -t SEVICEID /bin/bash查看部署es节点的/etc/hosts地址是否冲突在Docker Swarm集群中,在删除Docker集群节点后,集群中该节点仍然存在,但...
2018-10-22 23:17:40 558
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人