间隔了好多天呀~ 继上次写完第一part,跑去云南蹦跶了几天,下一周又轮到实验室我pre,紧接着下一周又跑去了茂名。时间就是介样 被我揉进了生活里,也就看不清时间和所谓意义之间的关系了~
上次我们介绍完机器学习几大分类,我们现在先来踩机器学习其中一个大类——监督学习。监督学习中最为常见的就是回归和分类了。本章着重讲回归!
一、回归&分类区别
- 回归问题是指,建立预测模型,根据训练集推断它所对应的输出值(实数)是多少,是一种定量输出,也叫连续变量预测。
分类问题是指,建立预测模型,根据训练集推断它所对应的类别(如:+1,-1),是一种定性输出,也叫离散变量预测。(参考:https://blog.csdn.net/u010995990/article/details/80620179) - 分类算法得到是一个决策面,用于对数据集中的数据进行分类;回归算法得到是一个最优拟合线,这个线条可以最好的接近数据集中的各个点。
- 在监督分类中,我们我们通常会使用正确率等作为指标,也就是预测结果中分类正确数据占总数据的比例;在回归中,我们通常用决定系数R-squared等模型来评估模型的好坏,也就是通过数据的变化来表征一个拟合的好坏。
二、回归模型
- step 1: A set of function
建模,考虑自变量的个数,因变量的类型及回归线的形状。比如,有多少输入变量,因变量和自变量的线性关系否,拟合曲线是否是直线等。