语言:python
框架:TensorFlow
课程大纲:
作业:
深度学习:提供了一种处理非结构化环境的工具。
非结构化:不能提前预测环境中所有东西的布局。
强化学习:提供了一种可以做决策是数学框架。
模型:enviroment, agent, action, reward,不断循环。、
what is DRL?
学习是智慧的基础:
非结构化:不能提前预测环境中所有东西的布局。
模型:enviroment, agent, action, reward,不断循环。、
what is DRL?
学习是智慧的基础: