自己颓了很长的时间,这时间换做以前精力充沛效率高超的自己不知道这段时间能做出多少东西来..
以前还有阿Q精神来激励自己.. 现在都没了,一点也提不起来。
以前看强化学习的东西,它的核心
奖励policy:state -> choose action ->reward -> next state
状态转移:Qi-1 -> Qi -> Qi+1
越来越让我觉得像人生,越来越觉得只有强化学习才算得上真正的人工智能……
这几年一直努力,却没有什么reward。那这样.. 还怎么成长?
成长就是reward,会走路,受到鼓励,做错事有penalty...如果
但是我自己的世界观和方法论完全对不上。
世界观1:
y——你的成就
K——家庭背景资源
x——你的努力
b——家庭出身
很好解释,有钱人家不仅会提高你的起点,还会放大你的努力。付出同样的努力,一般人也就考个985,但是有钱人家的孩子可以上伯克利……
就好比你摆个地摊和王思聪开个娱乐公司难度一样。
自己先天条件就不好,要比常人更努力,却没做到