- 博客(3)
- 资源 (7)
- 问答 (1)
- 收藏
- 关注
原创 强化学习——马尔科夫决策过程 MDP
文章目录1. 马尔科夫过程 Markov Process,MP1.1. 马尔科夫性质 Markov Property1.2. 马尔科夫链 Markov Chain2. 马尔科夫反馈过程 Markov Reward Process,MRP3. 马尔科夫决策过程 Markov Decision Process,MDP马尔可夫决策过程是强化学习里面的一个基本框架,在马尔可夫决策过程的定义中,Agent所处的环境是 Fully Observable ,就是全部可以观测的。但是很多时候环境里面有些量是不可观测的,这
2020-11-29 12:22:46 3759 2
原创 强化学习——强化学习概述
本篇博客是对强化学习的基本概念进行解释,无深入的算法推导文章目录1.强化学习 Reinforcement Learning1.1. 强化学习的目的1.2. 强化学习的过程1.3. 强化学习的特点2. 序列决策过程 Sequential Decision Making2.1. 智能体(Agent)与动作空间(Action Spaces)2.1.1. 智能体 Agent2.1.1.1. 策略函数2.1.1.2. 价值函数2.1.1.3. 模型2.1.1.4. 智能体的分类2.1.2. 动作空间 Actio.
2020-11-20 20:12:55 1830 2
原创 英文文献调研方法综述
文章目录1. 进行英文文献调研的理由2. 文献调研的纲要2.1. 文献调研的目的2.2. 文献调研的原则2.3. 文献调研的步骤3. 常用的论文搜索平台及数据库3.1. Text Analyzer - JSTOR3.2. Web of Science3.3. Google Scholar3.4. CORE & DOAJ3.5. ProQuest3.6. Google Images & ScienceDirect Images4. 常用的数据搜索平台及数据库4.1. Research Data
2020-11-09 20:50:06 7026 13
2020-2021顶会关于推荐系统中的解决偏差(bias)问题的文献汇总.zip
2022-02-22
机器学习到底要不要大数据的支持,如果要数据的支持,支持到哪一步?
2017-12-16
TA创建的收藏夹 TA关注的收藏夹
TA关注的人