1.强化学习 定义: 决策过程依赖于环境给出的反馈 Agent Enviroment State Action Reward 希望Reward最大 脉冲神经网络 Spiking NN 脉冲函数不可微分,无法使用梯度下降,不可使用无监督学习。 正确使用SNN,需要开发一种高效的监督学习 再硬件上模拟SNN需要模拟微分方程,消耗大量算力 2.最新进展 GAN生成图片 翻译,和人相似 自动送货 唇语识别