深度强化学习
码上中年
目前从事于开发大数据平台开发,主要是开发特征工程工具、机器学习算法。然后将平台开发好供公安系统进行各种数据挖掘,分类,预测。
展开
-
强化学习基础一
注:强化学习问题的求解主要是基于动态规划算法强化学习的知识点1. 强化学习的基本模型: MDP2. 利用和探索3. 值函数和动作4. 模型的求解方式,包含值迭代和策略迭代的求解算法5. 无模型学习算法,包括蒙特卡洛算法-MC算法和时序差分算法-TD算法6. 逆向强化学习简述1. 如何使用马尔科夫决策过程描述一个强化学习的问题1. 隐马尔可夫模型HMM是一个关于时序的概率模型,描...原创 2019-11-24 18:36:15 · 112 阅读 · 0 评论 -
深度强化学习理论学习
1. 强化学习 是一种学习如何能够最大化当前场景中的奖励值得学习方法,实际上就是一种从状态到动作的映射关系的学习,通过奖励值最大化来终结学习。2. 强化学习两大特征: 实验式求解方式(试错法)、奖励延迟机制3. ...原创 2019-11-24 16:14:32 · 717 阅读 · 0 评论