state:全局的状态,是全局的observation:agent的观测,是局部的 如果是单一agent的场景下,state和observation并没有区别 如果是多agent的场景下,则每个agent的observation与全局的state是不一样的