熟悉机器学习的三大主要任务
机器学习是什么?机器学习的一个目标是通过数学模型去理解数据,找到数据中的规律,以用来分析和预测数据。数据一般是一个向量组,这个向量组中的每个向量被称为样本,我们用 xi 来表示一个样本,其中 i=1,2,3,…,N ,共N个样本,每个样本 xi=(xi1,xi2,…,xip,yi) 共p+1个维度,前p个维度的每个维度我们称为一个特征,最后一个维度 yi 我们称为因变量(响应变量)。特征用来描述影响因变量的因素,如:我们在探索身高是否会影响体重的关系时,根据数据是否有因变量,机器学习的任务可分为有监督学习和无监督学习。
- 有监督学习:有监督学习给定了某些特征以预测因变量的结果,常用来推测结果和预测未来。
- 无监督学习:给定了某些特征但是没有因变量,用来寻找数据中的结构关系。
根据因变量是否是连续的,有监督学习分为两大任务:回归和分类:
- 回归的因变量是连续的
- 分类的因变量是离散的
%matplotlib inline //调用matplotlib.pyplot的绘图函数plot()进行绘图的时候,或者生成一个figure画布的时候,可以直接在你的python console里面生成图像.
plt.style.use(“ggplot”) //使用ggplot风格绘图