Datawhale X 李宏毅苹果书 AI夏令营 - Day1

椰子柠檬水

已于 2024-08-26 17:40:16 修改

阅读量216

点赞数 1

文章标签：人工智能机器学习深度学习

于 2024-08-26 15:37:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_61443215/article/details/141565290

版权

Day1

三种方式：1）回归（Regresison） - 找出正确答案。2）分类Classification - 根据选项做选择题 3）结构化学习（Structure learning): 生成有结构化的，如文章图片等

目的：知道输入和输出，找出中间复杂的计算函数（know why）

方式：根据对过去已有的经验/数据 - 领域知识（domain knowledge）来预测未来的可能性，找出最接近现实的那个

1）定义模型

如何决定参数（未知，parameter）？实际衡量方式就是看预测和实际的差距，取平均

MSE（Mean Square Error)：预测值和label 差值的平方

MAE （Mean Absolute Error）：预测值和lable 差值的绝对值

2）设置Loss function

Loss function 为什么是负的？- 可以自己定义

3）找到optimization

方式：给parameter随意找两个点，w0和b0，使用梯度下降的方法不断向梯度为0的最小点移动，移动大小取决于学习度（learning rate）。这种需要手动设置的叫hyper parameter。

梯度下降的局限性：
- 局部最小点v.s全局最小值：找到的梯度为0的可能只是局部最小点，而不是全局最小点

参数调整后loss变化不大的原因？gradient消失了

gradient为0有几种情况：1）最低点 2）最高点 3）saddle point 鞍点

所以需要查到底是最小点还是鞍点 ->> 使用Taylor series approximation 可以查看某个点附近的loss function，按照taylor series approximation公式展开一共有三部分：

1）模拟的loss fucntion

2）theta 和 theta‘ 的距离有多近

3）海森矩阵（Hessian matrix） -> 通过二次微分来判断是最高点、最低点还是鞍点

椰子柠檬水

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。