2 深入了解机器学习 (Descending into ML):线性回归

人们早就知晓,相比凉爽的天气,蟋蟀在较为炎热的天气里鸣叫更为频繁。数十年来,专业和业余昆虫学者已将每分钟鸣叫声和温度方面的数据编入目录。Ruth阿姨将他喜爱的蟋蟀数据库作为生日礼物送给您,并邀请您自己利用该数据库训练一个模型,从而预测鸣叫声与温度的关系。

首先建议你讲数据绘制成图表,了解下 数据分布情况:


图 1. 每分钟的鸣叫声与温度(摄氏度)的关系。

毫无疑问,此曲线图表明温度随着鸣叫声次数的增加而上升。鸣叫声与温度之间的关系是线性关系吗?是的,您可以绘制一条直线来近似地表示这种关系,如下所示:


图 2. 线性关系。

事实上,虽然该直线并未精确无误地经过每个点,但针对我们拥有的数据,清楚地显示了鸣叫声与温度之间的关系。只需运用一点代数知识,您就可以将这种关系写下来,如下所示:

y = mx + b y=mx+b

其中:

1, y指的是温度(以摄氏度表示),即我们试图预测的值

2, m指的是直线的斜率

3, x表示每分钟鸣叫的次数,即输入特征值

4, b指的是y轴截距


按照机器学习的惯例,您需要写一个存在细微差别的模型方程式:

y' = b + w1*x1

其中:

1, y'指的是预测标签(理想输出值)

2,b指的是偏差(y轴截距)。而在一些机器学习文档中,它称作w0 .

3,   w1指的是特征1的权重。权重与上文中用m表示斜率的相同概念。

4, x1指的是特征(已知输入项)。

要根据新的每分钟鸣叫声值x1推断(预测)y' ,只需将x1带入此模型即可。

下标(例如w1 和 x1)预示着可用多个特征来表示更复杂的模型。例如具有三个特征的模型可用采用下方程式:

y' = b + w1*x1 + w2*x2 + w3*x3


训练与损失


待续。。。








  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值