-
OpenAI
OpenAI 是一个非营利的人工智能(AI)研究组织,旨在通过促织和发展友好的人工智能,而使人类整体受益。OpenAI成立于2015年底,总部位于旧金山,组织目标是通过与其他机构和研究者的“自由合作”,向公众开放专利和研究成果。创始人伊隆·马斯克以及萨姆奥特曼的动机是出于对普遍的人工智能潜在风险的担忧。
简单来说,就是钢铁侠和奥特曼合作拯救地球的一个小计划。
OpenAI在机器学习方面关注两个关键点:无监督学习和强化学习
-
Gym
Gym是OpenAI在2016.5.4发布的研究和比较强化学习算法工具集。
-
基本教程
- Deep Reinforcement Learning from OpenAI
- mandalalala
- 官方文档
- 莫烦Python
- 基本概念
- agent:智能体
- environment:环境,gym内包含多种环境
- action:行动
- state:状态,智体做出一个行动,环境会相应的给出反应,返回一个状态和奖励
- reward:奖励,根据游戏规则的得分,对智体的反馈修正其行动。
OpenAI Gym简介及初级实例
最新推荐文章于 2024-05-17 15:07:22 发布