人工智能、机器学习、深度学习、强化学习、深度强化学习

最新推荐文章于 2024-02-14 11:05:46 发布

YYYa77

最新推荐文章于 2024-02-14 11:05:46 发布

阅读量1.3k

点赞数 1

分类专栏：强化学习文章标签：人工智能

本文链接：https://blog.csdn.net/a999999123/article/details/119735135

版权

强化学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

人工智能 （Artificial Intelligence）：人工智能研究的各个分支包括计划调度、专家系统、多智能体系统、进化计算、模糊逻辑、机器学习、知识表示、计算机视觉、自然语言处理、推荐系统、机器感知等等。
机器学习（Maching Learning）：是实现人工智能的一种手段
深度学习（Deep Learning）：是一种机器学习的技术。通过大量的数据训练，发现数据的规律，从而实现基于监督学习的数据预测，需要有监督的方式训练模型，训练的结果严重的依赖于标签的质量。
强化学习（Reinforcement Learning）：是一种机器学习的技术。区别于监督学习，强化学习具有很强的决策优化能力。机器处在一个环境中，每个状态为机器对当前环境的感知；机器只能通过动作来影响环境，当机器执行一个动作后，会使得环境按某种概率转移到另一个状态；同时，环境会根据潜在的奖赏函数反馈给机器一个奖赏。综合而言，强化学习主要包含四个要素：状态、动作、转移概率以及奖赏函数。
实例：关于强化学习和深度学习的实例，最典型的莫过于谷歌的AlphaGo和AlphaZero两位了，前者通过深度学习中的深度卷积神经网络，在训练了大约三千万组人类的下棋数据，无数度电的情况下才搞出来的模型，而后者使用强化学习的方式，通过自己和自己下棋的方式搞出来的模型。而最终的实验结果也很让人震撼。AlphaGo干败了人类围棋顶尖高手,而AlphaZero干败了AlphaGo.
深度强化学习（Deep Reinforcement Learning）：深度学习与强化学习的结合，可以自主挖掘问题特征。
例：2013和2015年DeepMind的Deep Q Network（DQN）可谓是将两者成功结合的开端，它用一个深度网络代表价值函数，依据强化学习中的Q-Learning，为深度网络提供目标值，对网络不断更新直至收敛。

YYYa77

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
人工智能、机器学习、深度学习、强化学习、深度强化学习

人工智能（Artificial Intelligence）：人工智能研究的各个分支包括计划调度、专家系统、多智能体系统、进化计算、模糊逻辑、机器学习、知识表示、计算机视觉、自然语言处理、推荐系统、机器感知等等。机器学习（Maching Learning）：是实现人工智能的一种手段深度学习（Deep Learning）：是一种机器学习的技术。通过大量的数据训练，发现数据的规律，从而实现基于监督学习的数据预测，需要有监督的方式训练模型，训练的结果严重的依赖于标签的质量。强化学习（Reinforcemen
复制链接

扫一扫