引言:
这篇博客主要是学习清华大学车辆学院 李升波老师(Shengbo Eben Li)的PPT课件的一些心得体会。
深度强化学习系列【1】- 强化学习的背景、基础理论等
1. 深度强化学习的背景、发展与理论变迁
1.1 序
Out of TAO, One is born;
One produces Two;
Two produces Three;
Out of Three, the Universe is created.
by Lao Tzu
老子的一生二,二生三,三生万物 可以说是世界进化发展史的一个描述,当然这里面似乎缺乏适者生存的进化论思想。这部分没有听过李升波老师的演讲,所以还不明白智能和这块怎么牵扯到一块。。。
顺着这个话题,我们简要讨论下生物界神经元的数目。水母(Jellyfish)只有5x10E3的神经元,而果蝇只有5.6x10E3 的神经元。而人类有86亿神经元。当然这个神经元体量的比较可能并不合理,因为近