![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/3a5c17c923d51c317238cded9ce698cc.jpeg)
大家好,已经很久没有更新这个专栏了,希望当初关注它的知友们还在……
我要厚着脸皮解释一下了。
本专栏的主题是方法论,而任何方法论都属于有限的经验体系,一旦成型,其更新速率就会显著放慢,就好像成年大树的主干相对稳定,全靠末梢的枝繁叶茂来彰显生命力。
当然,停更的这段时间我没有闲着,在更广泛调研和实践的基础上,我对DRL落地过程中的方法论体系重新做了梳理,并汇总成这本书——《深度强化学习落地指南》。
记一次成功的Exploration
两年前,当我开始写作这个专栏的时候,从未想过有朝一日与中国最好的技术出版社合作出书,或者受邀站在中国最高学府的讲台上分享心得。
假如我是一个游弋在生活解空间中的Agent,这次无心的探索显然收获了巨大回报。
过去几年间,我有幸参与了若干不同领域的强化学习落地项目,在为提高算法性能而绞尽脑汁的过程中,逐渐意识到其中的诸多环节都具有共性。
经过与同事反复讨论,我确认这些并非牵强附会,而是广泛存在的客观规律,于是便有了以备忘为出发点的专栏