线性回归算法

一、具体实例

  第一个学习的算法是线性回归算法。下面通过一个实例开始。
  这是一个预测房价的实例,我们要使用一个数据集,数据集包含A市的住房价格。在这里,我要根据不同房屋尺寸所售出的价格,画出我的数据集。比方说,如果你朋友的房子是 50平米,你要告诉他们这房子能卖多少钱。那么,你可以做的一件事就是构建一个模型,也许是条直线,从这个数据模型上来看,也许你可以告诉你的朋友,他能以大约左右500万的价格卖掉这个房子。这就是监督学习算法的一个例子。

  它被称作监督学习是因为对于每个数据来说,我们给出了“正确的答案”,即告诉我们:根据我们的数据来说,房子实际的价格是多少,而且,更具体来说,这是一个回归问题。回归一词指的是,我们根据之前的数据预测出一个准确的输出值,对于这个例子就是价格,同时,还有另一种最常见的监督学习方式,叫做分类问题,当我们想要预测离散的输出值,例如,我们正在寻找癌症肿瘤,并想要确定肿瘤是良性的还是恶性的,这就是 0/1 离散输出的问题。更进一步来说,在监督学习中我们有一个数据集,这个数据集被称训练集。

下面我们用m来表示训练样本的数量

以之前的房屋交易问题为例,假使我们回归问题的训练集(Training Set)如下表所示:

面积/平方米价格/万元
10100
20206
30310
40423
50546
60700
70770
80892
901000
1001136

我们将要用来描述这个回归问题的标记如下:

m  代表训练集中实例的数量

x  代表特征/输入变量

y  代表目标变量/输出变量

(x, y)  代表训练集中的实例

(x⁽ⁱ⁾, y⁽ⁱ⁾)  代表第i  个观察实例
h  代表学习算法的解决方案或函数也称为假设(hypothesis)

这就是一个监督学习算法的工作方式,我们可以看到这里有我们的训练集里房屋价格。

我们把输入给我们的学习算法,学习算法开始工作,然后输出一个函数,通常表示为小写 h表示。h  代表 hypothesis(假设),h表示一个函数,输入是房屋面积大小,就像你朋友想出售的房屋,因此 h 根据输入的 x值来得出 y  值,y  值对应房子的价格 因此,h  是一个从x到 y  的函数映射。

h该如何表示呢?

一种可能的表达方式为:h(x)=wx+b,因为只含有一个特征/输入变量,因此这样
的问题叫作单变量线性回归问题。

但是在后面的学习中,你会看到,一个回归变化问题,输出不止受一个变量的影响,比如说上面房屋交易的例子,最后预测的房屋的价格,也会受我是数量,或者所在区域的影响,或其他的特征。

这就是线性回归,其原理就是构造一个函数,在许多机器学习中被引用。
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
线性回归算法的发展历程可以追溯到19世纪末。以下是线性回归算法的发展历程: 1. 19世纪末,高尔顿和他的学生K·Pearson观察了1078对夫妇,以每对夫妇的平均身高作为自变量,取他们的一个成年儿子的身高作为因变量。他们发现父母身高和子代身高之间存在近乎一条直线的关系,即回归直线方程为:y^=33.73+0.516x。这是线性回归算法的最早应用之一。 2. 在20世纪初,统计学家卡尔·皮尔逊进一步发展了线性回归算法。他提出了最小二乘法,用于拟合回归直线并估计回归系数。最小二乘法通过最小化残差平方和来确定最佳拟合直线,使得预测值与实际观测值之间的差异最小化。 3. 在20世纪中叶,计算机的发展使得线性回归算法得以广泛应用。计算机的出现使得回归分析的计算更加高效和准确。此时,线性回归算法开始在各个领域得到广泛应用,包括经济学、社会科学、医学等。 4. 随着时间的推移,线性回归算法不断发展和改进。研究人员提出了各种改进的线性回归模型,如多元线性回归、岭回归、lasso回归等。这些改进的模型考虑了更多的因素和变量,提高了模型的预测能力和解释能力。 5. 近年来,随着机器学习和深度学习的兴起,线性回归算法也得到了进一步的发展。线性回归算法被用作其他更复杂模型的基础,如神经网络中的线性层。 总结起来,线性回归算法的发展历程可以追溯到19世纪末,经过了统计学家的研究和改进,以及计算机的发展,逐渐成为一种广泛应用的预测和分析工具。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值