没有标签:利用数据的分布学习
交互过程中成功和失败中学习,决策行为来获得反馈
就是更新参数
损失函数
梯度下降法
机器学习基本思想
最新推荐文章于 2022-05-13 18:48:10 发布
没有标签:利用数据的分布学习
交互过程中成功和失败中学习,决策行为来获得反馈
就是更新参数
损失函数
梯度下降法