积分(integral calculus)
微分(differential calculus)可微(differentiable)
变得更好意味着最小化一个 损失函数(loss function)
最终,我们真正关心的是生成一个能够在我们从未见过的数据上表现良好的模型。但我们只能将模型与我们实际能看到的数据相拟合。
因此,我们可以将拟合模型的任务分解为两个关键问题:
(1)优化(optimization):用模型拟合观测数据的过程;
(2)泛化(generalization):数学原理和实践者的智慧,能够指导我们生成出有效性超出用于训练的数据集本身的模型。
亚导数 处理了不可微点
高数课本的梯度 结合方向导数
导数的四种情况
1略
2 标量对向量
3.向量对标量
4.向量对向量 先都化为列向量
扩展