对于机器学习的学习我们一般将scikit-learn作为学习工具,scikit-learn简称sklearn,它集成了大量机器学习相关的工具开发库。
具体可以参考官网:http://scikit-learn.org/stable/index.html
sklearn使用的是python语言,在安装sklearn之前,我们需要下面准备工作。
1、安装Python (>= 2.6 or >= 3.3)开发环境
Python的安装比较简单,直接进入官网https://www.python.org/downloads/,我们就可以进行下载安装了。
2、安装NumPy (>= 1.6.1),SciPy (>= 0.9)这两个包
它们两个的安装分别进入官网就可以看到安装步骤了
http://www.scipy.org/install.html
另外,需要说明的是,最简单的方法就是使用python的科学计算工具,它集成了Python环境以及支持各种python科学计算开发包,例如NumPy ,SciPy 等等。
1、Anaconda
支持Linux, Windows 和 Mac
支持Linux, Windows 和 Mac
只支持Windows
只支持Windows
5、Pyzo
支持Linux, Windows 和 Mac
安装了上面的工具,就相当于安装了Python、IPython和一些包等等。
上面对应的都是python的一些科学计算工具,它们的强大之处就在于提供了python可视化环境和科学计算依赖包。主要用于进行一些科研实验,就是matlab的作用一样。
这里穿插说说Python、IPython、Ipython notebook和Spyder
- ipython是一个 python 的交互式 shell,比默认的python shell 好用得多,支持变量自动补全,自动缩进,支持 bash shell 命令,内置了许多很有用的功能和函数。
- IPython Notebook使用浏览器作为界面,向后台的IPython服务器发送请求,并显示结果。在浏览器的界面中使用单元(Cell)保存各种信息。Cell有多种类型,经常使用的有表示格式化文本的Markdown单元和表示代码的Code单元。
- Spyder是一个简单的python集成开发环境。和其他的Python开发环境相比,它最大的优点就是模仿MATLAB的“工作空间”的功能,可以很方便地观察和修改数组的值。具体可以参考:https://github.com/spyder-ide/spyder
当上面的准备工作完成之后,我们就可以安装sklearn了
pip install -U scikit-learn
对于python的项目开发有一款强大的集成开发工具PyCharm
PyCharm是一种Python IDE,带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,比如调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制。此外,该IDE提供了一些高级功能,以用于支持Django框架下的专业Web开发。
PyCharm具体的安装参考官方网站:
http://www.jetbrains.com/pycharm/index.html
在PyCharm里面我们可以直接进行手动的安装scikit-learn以及其他的一些开发包,非常的方便。
另外可以将上面的科学技术工具和python集成开发工具PyCharm结合一块,进行项目的开发。