跟李沐老师动手学习AI学习笔记：第四章——多层感知机

最新推荐文章于 2024-07-16 16:54:05 发布

AndrewPerfect

最新推荐文章于 2024-07-16 16:54:05 发布

阅读量261

点赞数

分类专栏：跟李沐老师动手学习AI——pytorch 文章标签：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Oxford1151/article/details/130771380

版权

跟李沐老师动手学习AI——pytorch 专栏收录该内容

6 篇文章 2 订阅

订阅专栏

4.1 感知机 [二分类问题——0、1问题]

1、感知机

2、训练感知机

3、收敛定理

4、XOR问题（异或运算问题）

感知机不能拟合XOR函数，只能产生线性分割面。

5、总结

4.2 多层感知机

1、学习XOR（异或运算）

2、单隐藏层

[ $\sigma$ 选择非线性的激活函数的目的：如果 $\sigma$ 是线性函数，则得到的output和input还是线性的关系，所以不能用线性激活函数]

3、多层分类（运用softmax）

4、多隐藏层

5、总结

4.3 多层感知机从零开始实现（代码）

4.4 多层感知机的简洁实现

4.5 模型选择

1、一些基本概念

·训练误差：模型在训练数据上的误差；

·泛化误差：模型在新数据上的误差；

·验证数据集：一个用来评估模型好坏的数据集；（注：不要和训练数据集混在一起）

·测试数据集：只用一次的数据集；

·K-则交叉验证：（在有足够多数据时使用），将训练数据分成K块，for循环i=1……k，第i块作为验证数据集，其他作为训练数据集，然后求K个验证集误差的平均值。（K常取5或10）

2、过拟合、欠拟合

4.6 模型选择、过拟合、欠拟合（代码）

4.7 权重衰退

（代码）

4.8 暂退法or丢弃法（dropout）

（代码）

4.8 数值稳定性+模型初始化和激活函数

1、数值稳定性

2、模型初始化和激活函数

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
跟李沐老师动手学习AI学习笔记：第四章——多层感知机

选择非线性的激活函数的目的：如果是线性函数，则得到的output和input还是线性的关系，所以不能用线性激活函数]
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。