课外阅读: 随机梯度下降(SGD)与经典的梯度下降法的区别 随机梯度下降(SGD)与经典的梯度下降法的区别 - 百度文库https://wenku.baidu.com/view/581f18d64593daef5ef7ba0d4a7302768e996f8a.html Batch、Mini-batch和随机梯度下降的区别和Python示例 https://baijiahao.baidu.com/s?id=1665861710638558010&wfr=spider&for=pchttps://baijiahao.baidu.com/s?id=1665861710638558010&wfr=spider&for=pc