Datawhale X 李宏毅苹果书 AI夏令营深度学习入门Task_2笔记

最新推荐文章于 2024-10-07 22:02:48 发布

七七-qiqi

最新推荐文章于 2024-10-07 22:02:48 发布

阅读量457

点赞数 4

文章标签：人工智能深度学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62746405/article/details/141738263

版权

1.线性模型（Linear Model）

（1）基本原理

将输入的特征 x 与一组权重 w 相乘，并加上一个偏置 b，得到预测结果 y。

数学表达式如下：

y = b + w1x1 + w2x2 + … + wnxn

其中，xi 代表第 i 个特征，wi 代表该特征的权重，b 代表偏置。

线性模型通过学习特征与结果之间的线性关系，来进行预测。例如，我们可以使用线性模型预测视频观看次数，其中特征可以是前一天的视频观看次数，权重和偏置则由模型学习得到。

（2）基本形式

一元线性模型：对于单个特征；
多元线性模型：对于多个特征；

（3）学习步骤

【1】模型假设：

选择模型框架
【2】模型评估：

定义损失函数 { 常用的损失函数是均方误差（MSE）}
【3】模型优化：

使用梯度下降等方法
{ 梯度下降法：通过迭代地更新模型参数和来最小化损失函数 }

（4）局限性

【1】模型表达能力有限：

线性模型只能表达线性关系，无法模拟更复杂的非线性关系。
【2】模型偏差较大：

当数据特征与结果之间存在非线性关系时，线性模型的预测误差会较大。

（5）改进

【1】增加特征数量：

通过增加特征数量，可以更好地捕捉数据特征与结果之间的关系。
【2】使用非线性激活函数：

如 Sigmoid 函数或 ReLU 函数，可以将线性模型转化为非线性模型，从而提高模型的表达能力。
【3】增加模型层数：

通过增加模型层数，可以构建更复杂的非线性模型，例如神经网络。

线性模型是深度学习的基础，虽然其局限性限制了其应用范围，但通过改进可以构建更复杂的非线性模型。深度学习模型具有强大的模型表达能力和泛化能力，是当前机器学习领域的研究热点。

2.线性模型（Linear Model）也许过于简单，需要更加复杂的模型——需要一个更加复杂、更有弹性的模型

Model bias：由线性模型自身导致的限制（无法模拟真实情况）

从分段线性曲线到连续曲线
所有的Piecewise Linear Curves（分段线性曲线）都可以由常数加上一系列折线函数之和；

（1）折线函数——Hard Sigmoid函数

当分段足够多时，可以用分段曲线来近似描述连续曲线（分段越多，近似的效果越好）

利用Sigmoid函数来逼近折线：

改变参数

图像变化

w

改变斜率（slope）

b

左右移动

c

改变高度

故下式为上方红色折线表达式：

（2）Rectified Linear Unit函数（ReLU）：

Hard Sigmoid函数相当于两个ReLU函数的相加：

（3）过拟合（Overfitting）：

在训练集上表现优秀，但在测试集上表现不佳；

复杂模型虽然具有更强大的表达能力，但在训练数据上误差非常小，而在测试数据上误差却很大，这就是过拟合。原因是高次模型中符合当前训练数据规律的函数可能不止一条，但真正符合实际数据规律的曲线只有一条。

关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。