- 特性
- 简单高效的数据挖掘和机器学习分析
- 对所有用户开放,根据不同需求高度可重用性
- 基于Numpy, SciPy和matplotlib
- 开源,商用级别:获得 BSD许可
- 覆盖问题领域
- 分类(classification)
- 回归(regression)
- 聚类(clustering)
- 降维(dimensionality reduction)
- 模型选择(model selection),
- 预处理(preprocessing)
- 安装scikit-learn
- 安装方式
- pip,
- windows installer
- easy_install
- 必要package
- numpy
- SciPy
- matplotlib
- 可使用Anaconda (包含numpy, scipy 等package)科学计算常用
- 注意:Python解释器版本(2.7 or 3.4), 32-bit or 64-bit系统 需要与package版本吻合
- 安装 Graphviz
使用方式:
转化dot文件至pdf可视化决策树:dot -Tpdf iris.dot -o outpu.pdf
转化dot文件至png可视化决策树:dot -Tpng iris.dot -o outpu.png