回归问题:
所谓的回归问题就是给定的数据集,且每个数据集中的每个样例都有其正确的答案,通过给定的数据集进行拟合,找到一条能够最好代表该数据集的曲线,然后对于给定的一个样本,能够预测出该样本的答案(对于回归问题来说,最终的输出结果是一个连续的数值)。比如,房价预测问题,最终的输出房价是一个连续的数值。回归问题是监督学习的一种。
分类问题:
与回归问题一样,分类问题同属于监督学习,与之不同的是,分类问题预测的结果输出是离散的值,比如判断一个人得的肿瘤是良性的还是恶性的,这就是0/1离散输出问题。
对于一个回归问题来说,它的一般流程为:
其中,h代表拟合的曲线,也称为学习算法的解决方案或函数或假设。
单变量的线性回归是回归问题的一种,它的表达式为:
hθ(x)=θ0+θ1x
由于它只有一个特征/输入变量x,同时它拟合的曲线是一条直线,所以该问题叫做单变量线性回归问题。
以房价问题为例,来举例说明回归问题。
对于回归问题来说,假设的选择是一个关键问题,在只有数据的情况下,如何确定h的形式?我们假设房价问题是线性回归,则 θ0 和 θ1 ,在房价问题这个例子中便是直线的斜率和在y轴上的截距。
但是我们如何选择参数 θ0 和 θ1 ,来使得到的线性拟合更加准确呢!这里需要引入一个代价函数(cost function),该函数的功能就是衡量了预测的结果与真正结果之间的差距。
在回归问题中我们一般选择均方误差代价函数(也叫作平方误差代价函数),它是解决回归问题最常用的手段,该函数的表达形式如下:
J(θ0,θ1)=12m∑mi=1(hθ(x</
斯坦福大学机器学习笔记——单变量的线性回归以及损失函数和梯度下降法(包含代码)
最新推荐文章于 2024-02-07 19:44:11 发布