为机器学习搭建好Python环境听起来简单,但有时候坑还不少。如果此前没有配置过类似的环境,很可能会苦苦折腾各种命令好几个小时。可是我明明只是想马上搞起来我的机器学习!
在优达学城(Udacity)此教程中,你将学到如何搭建一个稳定的机器python入门视频学习Python开发环境。你将能如愿直接开始机器学习大业,妈妈再也不用担心安装包的问题啦!
(1)配置Python3和Pip
第一步是安装Python的包管理器pip:
sudoapt-getinstallpython3-pip
(译者注:广大Linux发行商都在推荐apt代替apt-get,不妨一试)(译者又注:这里原文提供的是LinuxDebian系的安装命令,如果是MacOS,可以用homebrew来安装,而且如果通过homebrew安装python3,那么pip3会同时安装,则只需brewinstallpython3即可。)
有了pip,只需一个简单的pipinstall_your_package命令,我们就可以安装任何在Python包索引中编入索引的Python包,并带有一个简单的pipinstall_your_package_。之后我们也会用pip来设置虚拟环境。
接下来,将Python3设置为pip或python命令的默认值。这让使用Python3的时候更简便。如果不设置的话,当我们想用Python3,每次都需要输入pip3和python3。
为了将Python3强制设为默认命令,我们需要修改~.bashrc文件。在命令行执行下列命令:(译者注:这里原文提供的是LinuxDebian系的环境配置文件路径,如果是MacOS则需修改~.bash_profile。)
nano~.bashrc
向下滚动到#somemorelsaliases部分,加入下行:
aliaspython='python3'
(译者注:原文的方法有点麻烦,其实不用打开文件,可以直接使用标准输出就行,一行命令搞定:echo'aliaspython=python3'~.bashrc,MacOS同理:echo'aliaspython=python3'~.bash_profile)
保存文件、重载改动:
source~.bashrc
当当当!Python3现在成为你的默认Python了!
(2)创建虚拟环境
看python入门视频然后我们创建一个虚拟环境,并在当中安装机器学习所需的所有Python包。
我们使用虚拟环境来分离我们的编码设置。想象一下,假如有时候你想在你的计算机上做两个不同的项目,就需要不同版本的库。而把它们全部放在相同的工作环境中可能会带来意想不到的麻烦,很可能会遇到库版本冲突的问题。项目1的ML代码需要numpy的1.0版,但是项目2需要1.15版。啊哦!搞不定了。
而虚拟环境能让我们分离工作环境以避免这些冲突。
首先,安装相关包:
sudopipinstallvirtualenvvirtualenvwrapper
一旦安装好上述包,我们又需要编辑~.bashrc文件了。将下面三行放到文件末尾并保存:
exportWORKON_HOME=$HOME.virtualenvs
exportVIRTUALENVWRAPPER_PYTHON=usrbinpython3
sourceusrlocalbinvirtualenvwrapper.sh
保存文件,重载改动:
source~.bashrc
现在我们终于能如下创建虚拟环境了:
mkvirtualenvml
上面的代码中,我们创建了名为'ml'的虚拟环境。要进入该虚拟环境,输入:
workonml
棒!现在所有在ml虚拟环境下安装的库都会被隔离在该环境中,不会与其他环境冲突了!不论什么时候你想运行基于ml环境中的库的代码,只需要用workon命令进入该环境,然后正常运行代码即可。
如果需要退出虚拟环境,运行:
deactivate
(3)安装机器学习库
现在,我们可以安装机器学习库了。这里只会囊括最常用的几个:
numpy:用于任何矩阵的工作,尤其是数学运算scipy:科学计算pandas:数据处理,操作和分析matplotlib:数据可视化scikitlearn:机器学习
在此提一个一次安装所有包的小技巧:创建一个requirements.txt文件,像下面这样列出所有需要安装的包名称:
numpy
scipy
pandas
matplotlib
scikit-learn
保存文件,运行下面的命令:
pipinstall-rrequirements.txt
pip会直接一次性安装所有列在文件中的包。
恭喜,你的环境搭建好啦!机器学习之路,出发!