接上文,笔者又发现了两个细节 矩阵运算的l函数定义缺失 在阅读上图部分时,笔者一直在思考l是什么,再看之后发现,l此处指的是损失loss关于y的标量函数,因此l对于W的计算可以使用链式法则进行。 哈达玛积 在听李沐的课时,有一个哈达玛积,没有太在意,结果发现在此处用到了,这个⭕里面一个×的符号就是计算哈达玛积的,也称为元素乘或逐元素乘。这个运算是对两个同维度的矩阵进行逐元素相乘,结果是一个同样维度的矩阵。