线性模型太简单,需要设计更复杂的模型
任何一个分段线性曲线都可以用常数加上特殊的函数表示
当分割的片段足够多就可以表示连续的曲线
用sigmoid函数来逼近
调整参数可以获得不同形状的sigmoid函数,就可以近似预测函数
因此新的模型由简单的线性模型变成了更多参数的函数
用图形来理解
未知函数的更复杂,模型更新为
实际在做梯度下降时,会把很多的数据分成很多的小数据集(batch),只用一个batch算loss
每一次更新参数叫做update,把所有的batch都用过一遍叫做1epoch
可以用relu来代替sigmoid,两个relu可以组成sigmiod
有很多层的神经网络是深度学习