使用Linux服务器搭建个人深度学习环境
环境及所需工具
操作系统:Linux(CentOS 7)
配置所需工具:
Putty(操作服务器):
下载地址
WinSCP(本地与服务器之间传输文件):
下载地址
连接服务器
- 打开Putty,在左侧选择session,右侧点击SSH,输入地址
- 输入账号和密码
创建自己的python环境
-
查看环境:
conda info --envs
此时的Anaconda已经有2个环境(base和tensorflow_test),这两个环境时互不干扰的,他们有属于自己的python版本和深度学习框架版本,因为不同的人使用的版本可能不同,所以需要在evns下创建自己的环境。 -
创建环境:
conda create -n 自己的环境名 pyhton==版本号
在这一步的时候最好写清楚python的版本号,否则可能装的就是python的最新版本,不一定与自己的深度学习框架兼容。自己在复现别人的代码的时候最好看看对应的python版本和深度学习框架的版本,以免报错。
例如:conda create -n jave_tensorflow python==3.5.6
创建一个名为javie_tensorflow的环境,python版本3.5.6 。环境名最好用自己的名字_深度学习框架名(例如jave_tensorflow)框架名来命名,方便使用和查找。等待安装,遇到Process?(y/n),输入y就可以等待自己的python环境创建。
执行完之后使用conda info --envs
指令查看自己的python环境是否已经创建完成。
这里已经显示jave_tensorflow的环境已经创建完成,接下来需要创建深度学习的环境了。
创建深度学习框架的环境(以tensorflow为例)
- 进入自己的环境:
conda activate 自己的环境名
例如:conda activate jave_tensorflow
有时conda没反应的话使用source:source activate jave_tensorflow
我们的环境名出现在root前面的时候说明已经进入到自己的环境中了。
查看环境中的包都有哪些:conda list
这是我们在刚才安装python时的一些基础包。
现在安装tensorflow-gpu (gpu版本的tensorflow):
安装tensorflow-gpu:conda install tensorflow-gpu==版本号
例如:
conda install tensorflow-gpu==1.3
等待安装.
测试环境
自己的环境中,输入python进入到python编译器中:
输入:
import tensorflow as tf
hello = tf.constant('tensorflow test')
sess = tf.Session()
print(sess.run(hello))
成功!
退出python编译器指令:exit()
退出环境
conda deactivate
已经从jave_tensorflow环境中退出
删除环境
conda remove -n 环境名 --all
例如:conda remove -n jave_tensorflow --all
WinSCP的使用
- 打开软件,输入服务器地址、用户名、密码,回车
- 进入软件
- 将自己电脑中的python文件或文件夹拖到服务器中自己的环境下:
从WinSCP进入自己服务器的环境在/root/anaconda3/envs/
下:
这里我们将code文件夹拖拽到服务器中我们自己的环境的文件夹中,其实拖到服务器中的任何位置都行,主要是为了方便找到文件。
- 同理,你可以脱你想脱的任何文件,大家感兴趣的话,可以自己探索服务器.
跑深度学习程序(以上述code文件夹为例)
- 进入自己的环境:
conda activate jave_tensorflow
或source activate jave_tensorflow
- 从服务器 进入code文件夹
cd anaconda3/envs/jave_tensorflow/code
- 查看code文件夹下的内容:
ls
- 运行所需文件
在这里开始训练数据集:执行training.py
python training.py
等待执行,可能开始运行别人的程序的时候可能会报错,如果缺省包的话,安装所需包,在这里缺省的matplotlib包,进行安装:
conda install matplotlib