导论
- 机器学习重要目标:利用数学模型来发现数据中的规律,并作分析以及预测。
- 将数据的特征以及因变量用向量组成。根据数据是否有因变量分为:有监督学习和无监督学习。
- 根据因变量是否连续分为回归和分类。
1.1 回归
利用sklearn中datasets中的boston数据,由于房价数据为连续变量,则机器学习的任务称为回归。
1.2 分类
利用sklearn中datasets中的鸢尾花数据,鸢尾花数据的target为鸢尾花的不同种类,为不连续变量,则机器学习的任务为分类。
1.3 无监督学习
我们可以使用sklearn生成符合自身需求的数据集,下面我们用其中几个函数例子来生成无因变量的数据集:
link.
引用:机器学习基础,DW