强化学习一般指深度强化学习;
与监督学习、非监督学习并行但在实际学习过程中(episode)又与前者机理一致,所以强化学习也可以看做动态的机器学习;
从AI系统的角度,常见的深度学习算法CV、NLP等可以看做是基础功能实现,类比于眼睛、耳朵;而强化学习是基于这些功能的策略控制、决策实现,类比于大脑。
强化学习一般指深度强化学习;
与监督学习、非监督学习并行但在实际学习过程中(episode)又与前者机理一致,所以强化学习也可以看做动态的机器学习;
从AI系统的角度,常见的深度学习算法CV、NLP等可以看做是基础功能实现,类比于眼睛、耳朵;而强化学习是基于这些功能的策略控制、决策实现,类比于大脑。