《深度学习详解》Task2 #Datawhale X 李宏毅苹果书 AI夏令营

MLIM_air

已于 2024-08-27 16:48:24 修改

阅读量888

点赞数 29

文章标签：深度学习人工智能

于 2024-08-26 22:02:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_66246111/article/details/141574633

版权

线性模型

不断迭代更新模型。

领域知识：对于问题的理解

线性模型：把输入的特征x乘上一个权重，再加上一个偏置

分阶段线性曲线

分阶段线性曲线：一个常数加上一群其他函数（Hard Sigmoid 函数）
在一个曲线上取足够多或一定量位置适当的点，则可使分阶段性曲线逼近该连续曲线
则只要有足够多的函数组合起来，就可以变成任何的连续曲线
Hard Sigmoid函数：输入的值x小于某个定值而大于另一个定值时，函数图像会有一个斜坡（即，先水平，再斜坡，再水平）
Sigmoid函数：当值足够大时，会收敛再高度为c的地方，如果n负的非常大的时候，分母变大，y值趋近于0。于是可以用这个函数来逼近 Hard Sigmoid函数
$c\frac{1}{1+e^{-(b+wx_1)}}$
在这里插入图片描述

只有 w跟b两个参数的前提之下，可以穷举所有可能的跟b的值，所以在参数很少的情况下。甚至可能不用梯度下降，不需要优化的技巧。但是参数非常多的时候，就不能使用穷举的方法，需要梯度下降来找出可以让损失最低的参数。

模型变形

修正线性单元ReLU：ReLU的图像有一个水平的线，走到某个地方有一个转折的点，变成一个斜坡。 $c * max(0,b+wx_1)$
max(0,b + wx) 是指看 0跟b+wx:谁比较大，比较大的会被当做输出。
通过w,b,e可以挪动其位置和斜率。把两个ReLU叠起来就可以变成Hard的Sigmoid，想要用ReLU，就把Sigmoid的地方，换成max(0, b + wr)。

2个ReLU -> 1个Hard Sigmoid
1个Sigmoid -> 1个Hard Sigmoid

激活函数：类似于Sigmoid或ReLU的函数

反向传播：选训练时在没有看过的数据上表现好一点的模型。

机器学习框架

测试集：只有x没有y。{x^N+1， x^N+2，…，x^N+M}

训练集：训练模型。{(x¹,y¹)，(x²,y²)，…，(x^N,y^N)}

训练步骤：

写函数：写一个带有未知数θ的函数（代表一个模型里面所有的未知参数）
定义损失：输入一组参数判断参数的好坏
选取最优：找一个θ，让损失的值越小越好。损失最小的θ为θ*，ʘ* = argmin L

关注

29
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

MLIM_air CSDN认证博客专家 CSDN认证企业博客

码龄3年

9: 原创

52万+: 周排名

7万+: 总排名

7709: 访问

: 等级

278: 积分

128: 粉丝

186: 获赞

0: 评论

125: 收藏

私信

关注

热门文章

最新评论

STM32个人学习笔记不断更新中
CSDN-Ada助手: 非常感谢您持续更新关于STM32个人学习笔记的博客！GPIO在STM32芯片中的应用确实非常重要，通过对GPIO引脚的连接，可以实现与外部设备的通信和控制，这对于深入学习嵌入式系统编程非常有帮助。除了基本的输入输出功能，您可能还会遇到中断控制、定时器的应用等更加深入的知识，这些内容也值得您进一步学习和探索。期待您未来的更新，加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

【ShuQiHere】在 Linux 上运行 Windows 应用的最佳工具：全面比较与选择指南 658

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。