Datawhale X 李宏毅苹果书 AI夏令营

gonewitn

于 2024-08-23 23:06:50 发布

阅读量159

点赞数 5

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gonewitn/article/details/141473642

版权

机器学习

1.概念：

具备找一个函数的能力（looking for function）

能够识别输入，找到对应函数，给出相应输出

2.类别

1）regression回归

输出是数值（scalar）的函数

2）classification分类

要提前准备选项（class），以供函数输出

例：

3.案例

YouTube点击率

1）写出带有未知参数的函数式——模型（model）

$y=b+\omega x_{1}$

$y$ ：预测值
$x_{1}$ （feature）：已知数据
$b$ （bias）和 $\omega$ （weight）：未知参数

***权重和偏置实际未知，仅仅是源于已有资料的推测/猜测***

2）定义损失（loss）

$L(b,\omega )$

采用模型： $y=b+\omega x_{1}$

用于评估 $b$ 和 $\omega$ 的优劣——看 $y$ 与实际值的差值 $e$ （MAE或MSE）

$L=\frac{1}{N}\sum e_{n}$

L越大，参数越差

标签（label）：实际值
交叉熵：
误差表面：
红色误差大，紫色误差小

3）最优化问题

目的：寻找让L最小的 $b$ 和 $\omega$

梯度下降

随机选取初始点 $w^{0}$
计算点 $w^{0}$ 处的微分，向低处偏移
偏移步伐：1）与斜率成正比；2）受学习率 $\eta$ 影响
多参数类似（偏微分计算即可）

问题：

会陷入局部最小值（极小值）

扩大数据集以求更优解
梯度下降不一定总是快速收敛，其收敛速度取决于多个因素，如学习率的选择、问题的性质、损失函数的形状和初始化参数等，有些情况会收敛得很慢
梯度下降算法在多参数情况下与单参数情况基本相同，但需要同时更新所有参数

关注

5
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Datawhale X 李宏毅苹果书 AI夏令营

采用模型：用于评估和的优劣——看与实际值的差值（MAE或MSE）L越大，参数越差标签（label）：实际值交叉熵：误差表面：红色误差大，紫色误差小。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。