深度学习
文章平均质量分 93
_攒一口袋星星
这个作者很懒,什么都没留下…
展开
-
再认识RL
马尔可夫最重要的性质时下一时刻的状态只与当前状态有关。若数据流不具备该性质,可以利用循环神经网络对历史信息进行建模,获得包含历史信息的转台表征,最后在表征状态空间求解马尔可夫决策过程问题。,计算它的价值函数,也就是计算每个状态的价值。控制就是我们去寻找一个最佳的策略,然后同时输出它的最佳价值函数以及最佳策略。贝尔曼方程就是当前状态与未来状态的迭代关系,表示当前状态的价值函数可以通过下个状态的价值函数来计算。,0表示只关注当前的奖励,1表示未来的奖励与当前的奖励一致。:未来可能获得奖励的当前价值的表现。转载 2023-12-12 01:16:59 · 98 阅读 · 0 评论 -
图神经网络基础
cs224w 图机器学习 同济子豪兄课程学习笔记原创 2023-03-02 16:17:08 · 430 阅读 · 0 评论 -
神经网络与深度学习
神经网络与深度学习笔记原创 2023-02-27 18:42:20 · 368 阅读 · 0 评论 -
吴恩达机器学习--聚类和异常检测
吴恩达2022机器学习,聚类和异常检测原创 2023-02-15 11:24:48 · 819 阅读 · 0 评论 -
吴恩达机器学习--神经网络
吴恩达2022机器学习--神经网络部分原创 2023-02-14 21:03:33 · 847 阅读 · 1 评论