![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法
六路火车
探索,永无止境
展开
-
对于强化学习的梳理
强化学习(增强学习)概述知识联系强化学习是属于机器学习的一种,机器学习主要分监督学习、非监督学习、半监督学习、增强学习。强化学习的核心逻辑,那就是智能体(Agent)可以在环境(Environment)中根据奖励(Reward)的不同来判断自己在什么状态(State)下采用什么行动(Action),从而最大限度地提高累积奖励。定义及意义、目的描述:强化学习任务通常用马尔可夫决策过程...原创 2020-05-03 12:59:33 · 3090 阅读 · 2 评论 -
一些常见计算机算法
迭代算法(iteration)迭代是重复反馈过程的活动,其目的通常是为了逼近所需目标或结果(一个判断条件)。每一次对过程的重复称为一次“迭代”,而每一次迭代得到的结果会作为下一次迭代的初始值。递归算法(recursion)表现为程序的自身调用,把一个大的复杂的问题层层转换为一个小的和原问题相似的问题来求解。来源套用别人说过的一句话“迭代是人,递归是神”。递归实际上不断地深层调用函数,...原创 2019-10-10 17:31:44 · 1839 阅读 · 0 评论