Datawhale X 李宏毅苹果书 AI夏令营(第五期) Task 2 学习笔记

根据书中提到的,线性模型在预测任务中的应用及其局限性。尽管这个模型在训练数据上展现出了良好的拟合能力,通过调整权重和偏置参数(w和b),成功地将损失降低到了较低的水平,但在面对未知数据时,其预测性能却显著下降。具体来说,模型主要依赖于前一天的观看次数来预测隔天的观看人次,这种方法在捕捉数据的变化趋势上显得过于简单,未能充分考虑到数据中存在的复杂性和周期性特征。

通过进一步分析,我发现真实观看数据呈现出明显的周期性规律,每周五和周六的观看人次都会显著降低。然而,当前的线性模型并未能捕捉到这一重要信息,导致其在预测这些特定日期的观看人次时出现了较大的误差。所以,在构建预测模型时,除了考虑基本的数学关系外,还需要深入了解数据的内在规律和特性,以便更好地指导模型的设计和优化。

针对这一部分,书中提到了领域知识

书中的案例图展示了如何通过观察数据中的周期性模式(每7天一个循环)来构建更准确的预测模型。传统的仅考虑当前天数的模型,在面对具有明显周期性特征的数据时,表现不佳。因此,引入了一个新的模型,模型不仅考虑了当天的观看人次,还综合考虑了前7天的观看人次,并通过赋予不同的权重来反映这些天数对预测结果的不同影响,这种模型称为线性模型。

这一部分书中介绍了分段线性函数的概念,了解到在不同x值区间内,y与x的线性关系可以发生变化,如先增后减。分段线性函数在描述具有突变点的复杂关系时特别有用,如经济学中的需求函数。当分段线性模型不足以准确描述实际关系时,需要考虑更复杂的模型。此外,分段线性函数在优化问题中也有应用,如通过分段处理来简化问题求解。还了解到分段线性曲线可以由常数项与多个Hard Sigmoid函数组合而成,通过调整参数来模拟复杂的非线性关系。

这一部分,书中总结了线性回归与逻辑回归的区别与联系。两者在模型形式上具有相似性,都涉及到线性关系,但逻辑回归通过sigmoid函数引入了非线性因素,从而使其能够处理分类问题。书中还指出了这两种模型在实际应用中的不同场景,比如线性回归适用于预测房价、销售额等连续变量的场景,而逻辑回归则更适用于处理用户是否购买商品、邮件是否为垃圾邮件等二分类或多分类问题的场景。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值