1、python
本课程的机器学习的算法都是基于python语言实现的,所以你需要有一定的python语言基础,可以参考彭亮在麦子学院讲授的“Python语言编程基础”。
2、python机器学习的库:scikit-learn
特性:
1)简单高效的数据挖掘和机器学习分析
2)对所有用户开放,根据不同需求高度可重用性
3)基于Numpy, SciPy和matplotlib
4)开源,商用级别:获得 BSD许可
覆盖问题领域:
分类(classification),,回归(regression), 聚类(clustering),
降维(dimensionality reduction),模型选择(model selection), 预处理(preprocessing)
3、使用scikit-learn
方式一:pip, easy_install(两个都是python安装package的工具,感觉pip更好用)
方式二(推荐): 可使用Anaconda(这是一个科学计算环境 ,包含numpy, scipy,matplotlib等科学计算常用package,当然也包含scikit-learn包)
anaconda下载地址:www.continuum.io/downloads
anaconda安装注意问题:匹配的Python解释器版本(2.7 or 3.5), 系统版本(32位or64位)
4、安装Graphviz(数据可视化软件)
下载地址:www.graphviz.org
安装完成后,将C:\Program Files (x86)\Graphviz2.38\bin(找你的graphviz/bin的路径)加入到系统变量path中