scikit-learn简介:Python中的机器学习
本教程的目标
介绍机器学习的基础知识,以及一些在实践中有用的技能。
介绍scikit-learn的语法,以便您可以使用可用的丰富工具集。
时间表:
预备课程:设置和介绍(15分钟)
确保您的计算机已安装
机器学习和Scikit学习界面的基本原理(45分钟)
什么是机器学习?
机器学习数据布局
监督学习
分类
回归
衡量绩效
无监督学习
聚类
降维
密度估算
学习模型评估
为您的数据集选择正确的算法
有监督的深度学习(1小时)
支持向量机
决策树和随机森林
无监督的深度学习(1小时)
主成分分析
K均值聚类
高斯混合模型
模型验证(1小时)
验证和交叉验证
初赛
本教程需要以下软件包:
Python版本2.7或3.4+
numpy版本1.8或更高版本:http://www.numpy.org/
scipy版本0.15或更高版本:http://www.scipy.org/
matplotlib版本1.3或更高版本:http://matplotlib.org/
scikit-learn 0.15或更高版本:http://scikit-learn.org
具有笔记本支持的ipython / jupyter 3.0或更高版本:http://ipython.org
seaborn:0.5或更高版本,主要用于情节样式
获得这些的最简单方法是使用conda环境管理器。 我建议下载并安装miniconda。
以下命令将安装所有必需的软件包:
$ conda install numpy scipy matplotlib scikit-learn ipython-notebook
或者,您可以下载并安装(非常大的)Anaconda软件发行版,位于https://store.continuum.io/。
检查安装
您可以运行以下代码来检查系统上软件包的版本:
from __future__ import print_function
import IPython
print('IPython:', IPython.__version__)
import numpy
print('numpy:', numpy.__version__)
import scipy
print('scipy:', scipy.__version__)
import matplotlib
print('matplotlib:', matplotlib.__version__)
import sklearn
print('scikit-learn:', sklearn.__version__)