Linux
月夜长影
专注技术学习。
展开
-
安装docker以及nvidia-container-toolkit
旧版本的docker不支持GPU, 需要安装nvidia-docker才能运行支持GPU的docker image. 新的docker支持GPU后, nvidia-docker等工具移至nvidia-container-toolkit下面, 只要安装nvidia-container-toolkit和docker就可以使用支持GPU的docker image.原创 2023-10-13 15:33:31 · 3705 阅读 · 0 评论 -
[fix] libc10_cuda.so: undefined symbol: cudaMemPoolSetAttribute, version libcudart.so.11.0
conda复制环境后pytorch不能导入原创 2023-07-14 19:41:12 · 8251 阅读 · 3 评论 -
git id_rsa key过期
github更新key原创 2022-12-07 12:07:41 · 3354 阅读 · 0 评论 -
zsh资源记录
zsh相关的资源记录原创 2022-12-02 13:56:19 · 253 阅读 · 0 评论 -
bazel安装
centos安装bazel原创 2022-11-13 14:20:34 · 1210 阅读 · 0 评论 -
SSH命令登录Linux出现“Permission denied, please try again.”错误
检查系统的log文件:/var/log/auth.log 发现如下的记录May 7 03:41:09 ubuntu02-X785-G30 sshd[2598]: User xxx from 10.2.89.240 not allowed because not listed in AllowUsersMay 7 03:41:09 ubuntu02-X785-G30 sshd[2598]: input_userauth_request: invalid user xxx [preauth]May原创 2021-05-07 15:57:14 · 4108 阅读 · 0 评论 -
[解决方法] NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.
问题分析在进行nvidia-smi的时候, 发现输出如下错误,NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.搜索的网上的资源, 大多都是说要重新安装CUDA, 或者升级Linux headers之类的, 比较麻烦, 所以我想看看有没有其他的办法.原因分析: n原创 2021-01-18 21:44:10 · 3662 阅读 · 0 评论 -
NVIDIA NVML Driver/library version mismatch 解决方案
问题描述: 执行nvidia-smi的时候, 出现下述报错,原因分析: 因为刚安装了一个驱动, 原先的nvidia module没有卸载, 导致新的驱动模块加载不了.解决办法: 重启, 或者卸载原先加载的驱动# 卸载加载的nvidia驱动sudo rmmod nvidia_drmsudo rmmod nvidia_uvmsudo rmmod nvidia_modesetsudo rmmod nvidia# 再执行nvidia-smi就好了如果卸载某个mod的时候, 遇到错误, 比如原创 2020-10-21 15:19:37 · 8250 阅读 · 4 评论 -
Github加速下载笔记
前言: 有时git clone的速度只有十几KB/s, 太慢了, 所以搜索一些github加速下载的工具和资源, 这里如下使用镜像方法一先将repo克隆到码云上, 这份速度比较快, 然后从码云上下载. 提高github下载速度的方法【100%有效】可达到2MB/s方法二使用镜像网址进行clone, 在项目原地址上加上 .cnpmjs.org ,使用 cnpm 的镜像来下载 git 项目, 比如如下原地址:git clone https://github.com/jhao104/proxy_poo原创 2020-09-19 11:47:08 · 352 阅读 · 0 评论 -
git archive使用笔记
注: 未完成.git archive的时候, 要拥有对repo的访问权限.参考文章How to sparsely checkout only one single file from a git repository?git archive command with bitbucketRetrieve a single file from a repositorygit archive用法原创 2020-09-19 11:28:09 · 689 阅读 · 0 评论 -
阿里香港轻量服务器加上 BBR 会发生什么?阿里云轻量级服务器下载上传速度慢
转载链接: https://zhuanlan.zhihu.com/p/73565142买了阿里云香港轻量级服务器, 峰值网速带宽30Mbps, 但是本地下载服务器文件只有几十K, 于是搜索资料, 发现上面的解决办法, 速度提升很明显, 非常推荐.安装BBR前的下载速度:安装后的下载速度:安装步骤: 先卸载阿里云安骑士和一些残留文件, 然后安装BBR加速模块. 具体步骤如下步骤一卸载安骑士 首先卸载阿里云安骑士,教程转自https://www.wn789.com/11468.htmlwget转载 2020-09-19 11:01:09 · 1157 阅读 · 0 评论 -
kenlm安装和使用笔记
环境说明采用Debian系统和anaconda安装的python3.6安装依赖如果有root权限, 采用apt安装依赖即可. 见github的链接sudo apt install build-essential cmake libboost-system-dev libboost-thread-dev libboost-program-options-dev libboost-test-dev libeigen3-dev zlib1g-dev libbz2-dev liblzma-dev否则的话原创 2020-08-30 14:49:28 · 4358 阅读 · 4 评论 -
conda | An HTTP error occurred when trying to retrieve this URL 解决方案
问题描述conda安装包的时候, 下载中断, 导致安装失败, 报错信息如下所示:Error:CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://repo.anaconda.com/pkgs/pro/noarch/repodata.json.bz2>Elapsed: -An HTTP error occurred when trying to retrieve this URL.HTTP errors are of原创 2020-07-15 23:03:45 · 5147 阅读 · 1 评论 -
VSCode Go Golang不能跳转到定义解决办法 (问题排查)
环境说明mac vscodeGo版本: go version go1.13 darwin/amd64.使用go modules模式: go.mod文件表明模块和vendor目录存储第三方依赖.遇到的问题一vscode PROBLEM窗口提出出错:missing $GOPATH解决办法: 检查go是否安装成功, GOPATH是否设置成功.安装VScode-Go插件在vscode extensions中安装Go插件.插件配置: 使用gogetdoc和goimports不要选择la原创 2020-06-22 22:24:10 · 48453 阅读 · 7 评论 -
自动检测本地文件变动, 然后同步到服务器 (MacOS或Linux)
介绍在写代码的时候, 经常需要同步到服务器, 常用的编辑软件比如sublime或者vscode都有插件, 可以一个快捷键同步到服务器, 但是不是很方便, 这里介绍一个自动检测文件变化, 然后利用rsync进行同步.MacOS使用fswatch检测文件夹, 然后使用rsync进行传输.fswatch的安装:brew install fswatch同步的脚本, 不妨写到一个sync.sh...原创 2020-01-06 21:20:16 · 2841 阅读 · 0 评论 -
tmux | 使用手册 (cheat sheet)
Cheatsheet: tmuxCommand linetmux new -s {session_name} -n {name} - create new session and specify window nametmux {attach|a|at} -t {session_name} - attach to sessiontmux ls - list sessionstmux ki...原创 2019-12-25 14:57:19 · 1032 阅读 · 0 评论 -
nvidia-smi 风扇和电源显示ERR (Fan and Usage ERR)
问题分析在显卡上长时间运行很多的程序, 导致显卡过热, 出现问题.解决方法停掉所有的在显卡上运行的程序, ERR会消失设置显卡的persistence mode, 按照这个教程.限制最大的运行功率不要太大sudo nvidia-smi -pl 200 -i 2 # 指定卡2的最大功率为200再次运行nvidia-smi显示卡2的运行功率已经调整好了+-------------...原创 2019-12-23 14:01:37 · 10204 阅读 · 1 评论 -
nvidia-smi命令很长时间才输出
这是由于没有启动显卡的persistenced模式, 导致每次nvidia-smi, 如果没有程序再运行, 都要先进行初始化.解决方法:sudo /usr/bin/nvidia-persistenced --verbose# 再试一下应该可以了.nvidai-smi将上述命令加到开始启动的脚本中echo "/usr/bin/nvidia-persistenced --verbose"...原创 2019-12-18 14:42:03 · 10202 阅读 · 1 评论 -
sh: export: `:/usr/local/cuda-9.0/lib64': not a valid identifier
问题安装CUDA后, 配置文件填写如下,这样的话, 第二行等价于export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64 ${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}中间多了空格导致语法错误.解决办法改成一行的形式, 或者把空格都去掉export LD_LIBRARY_PATH=/usr/...原创 2019-12-18 14:34:54 · 2074 阅读 · 0 评论 -
Ubuntu16.04安装CUDA10.2, CUDA toolkit与驱动版本的关系, anaconda中CUDA toolkit与Nvidia的CUDA toolkit的关系
文章目录安装CUDA 10.2安装后操作安装cuDNNCUDA版本与驱动版本的关系Anaconda中的CUDA toolkit安装CUDA 10.2我的系统是Ubuntu16.04, 按照Nvidia官网的说明, 下载相应的deb包, 安装即可.安装指令如下wget https://developer.download.nvidia.com/compute/cuda/repos/ubun...原创 2019-12-18 09:45:48 · 20399 阅读 · 4 评论 -
Linux服务器上的程序突然全部停了
问题描述服务器上运行的程序, 突然之前全部停了, 不知道什么原因.问题分析所有的程序都停了, 说明是系统的问题, 而不是单个程序的问题.检查root把所有的程序同时kill了, 这个要问一下root用户检查服务器是否重启或者关机了# 查看系统重启记录last reboot# 查看系统开机记录uptime # 显示系统运行了多长时间who -b # 显示系统启动记录检查...原创 2019-12-08 10:05:34 · 1355 阅读 · 1 评论 -
SSH | 端口转发和反向隧道
端口转发描述:如果机器A能ssh连接服务器B,可以通过端口转发,让A访问B能访问的网络。如果B位于国外,可以用这实现代理。步骤一在A上,通过ssh连接B,连接的时候开启端口转发。# 将本地端口9000收到的数据转发到服务器Bssh -D 127.0.0.1:9000 USER_B@IP_B步骤二在浏览器或者终端,设置socks5代理,将数据转发到端口9000,从而可以转发到服务器B...原创 2019-11-07 18:54:19 · 1435 阅读 · 0 评论 -
rsync使用简介
介绍rsync是Linux下用于远程同步文件的工具,全称remote sync。rsync可以同步整个目录,同步链接指向的文件,增量同步,同步时排除特定文件,非常方便。rsync可以基于ssh协议传输,安全有保证。使用rsync命令格式为rsync [OPTION] SRC DST,其中SRC和DST可以是本地路径,或者远程路径USER@HOST:PATH,SRC还可以是多个路径,比如*.p...原创 2019-09-10 09:13:30 · 458 阅读 · 1 评论