强化学习个人感悟
强化学习就像是人类几代人不断的探索获得一个比较好的结果的过程,类似于适者生存的过程,但是就是通过机器的学习与算法在模拟这个过程,尽可能获得一个比较好的收益(对于机器来说)(对于我们来说是获得一个较准确的结果),通过算法模拟获得一个比较好的结果。
当然除了算法还有神经网络和Q表格之类的,可以把可能出现的非连续的或连续的情况进行模拟。通过数字等模拟建模生成一个对象进行反映,反映出来的数据就是我们的训练结果,结果好就是传说中的人工智能,不好那就是传说中的人工智障。
学习思路
首先是Python
基础,numpy
库、pandas
库、matplotlib
库等基础数据处理分析库 的掌握情况。
然后是一些数学的基础知识,有些时候不一定懂但是一定要回用,还有基础统计学知识。
接着是深度学习的和强化学习的理论课程,然后就是运用已有模型进行练习和学习。