击上方关注 “终端研发部”
设为“星标”,和你一起掌握更多数据库知识
正好,大家可以跟着我下面总结的一些资源来学习,相信收货一定很大!
1、Ai2Thor仿真环境
AI2-THOR的优势在于可以与环境中的物体进行互动,基于现实中的物理规则,具备高度的逼真性。此外,框架提供了python api供使用者调用。
论文:AI2-THOR: An Interactive 3D Environment for Visual AI
Arxiv:https://arxiv.org/abs/1712.05474
网站:http://ai2thor.allenai.org
Github:https://github.com/allenai/ai2thor
2、Deep-neuroevolution
作者:Uber AI实验室
GitHub地址:https://github.com/uber-common/deep-neuroevolution
1、Deep Neuroevolution: Genetic Algorithms Are a Competitive Alternative for Training Deep Neural Networks for Reinforcement Learning
论文地址:https://arxiv.org/abs/1712.06567
2、Improving Exploration in Evolution Strategies for Deep Reinforcement Learning via a Population of Novelty-Seeking Agents
论文地址:https://arxiv.org/abs/1712.06560
这些代码基于OpenAI此前公布的源代码和论文。
3、DeepMind控制套件
论文:DeepMind Control Suite
Arxiv:https://arxiv.org/abs/1801.00690
Github:https://github.com/deepmind/dm_control
环境:Python、MuJoCo
4、AI安全网格测试
文章:AI Safety Gridworlds
Arxiv:https://arxiv.org/abs/1711.09883
Github:https://github.com/deepmind/ai-safety-gridworlds
5、强化学习开源项目--OpenMedBox-DialoDiagnosis
这个项目旨在帮助进行相关研究的同行更容易的对该领域工作进行复现和扩展。
举个例子:开源自动化诊疗工具
OpenMedBox-DialoDiagnosis 是一个 DISC 自主开发的开源自动化诊断系统工具包,包括四个数据集和五种实验方法的复现,架构如图
项目 Github 地址:https://github.com/FudanDISC/DISCOpen-MedBox
5、MAgent强化学习研究平台
MAgent可视化模拟红蓝两军战斗的demo,通过训练一个共享参数DQN模型,最后宏观上智能体学会一些协同策略:合力追击(图2):
文章:MAgent: A Many-Agent Reinforcement Learning Platform for Artificial Collective Intelligence
Arxiv:https://arxiv.org/abs/1712.00600
Github:https://github.com/geek-ai/MAgent
环境:Linux、OS X、Python 2.7 or python 3
7、项目名称:coreylynch/async-rl
实现算法:A3C
相关论文:Asynchronous Methods for Deep Reinforcement Learning".
推荐理由:结合使用Tensorflow + Keras + OpenAI Gym
Pdf地址:http://arxiv.org/pdf/1602.01783v1.pdf
需要学习的框架:
baselines - openai
github:https://github.com/openai/basel
stable-baselines3
github:https://github.com/hill-a/stabl
FinRL
github: https://github.com/AI4Finance-F
spinningup - openai
github:https://github.com/openai/spinn
需要学习的课程:
基于强化学习是一种机器学习技术,这门功夫是从机器学习功中的神经网络中发扬光大起来的,其又可再细分多种网络: 线性神经网络、卷积神经网络、循环神经网络等。主要用于两大任务: 计算机视觉(Computer Vision,CV)、自然语言处理(NormalLanguage Process,NLP),ChatGPT就是NLP领域中的一个大模型(LLM)。入机器学习门派还得有与时俱进的精神,按照目前的趋势,大模型成为每个赛博炼丹师必须了解的功夫之一
推荐书籍:
《动手学深度学习》
《深度学习轻松学:核心算法与视觉实践》
《强化学习精要:核心算法与TensorFlow实现》
《强化学习》《深入浅出强化学习》
《Deep Learning》
《Neural Networks and Deep Learning》
《Deep Learning with Python》
《TensorFlow:实战Google深度学习框架》
《TensorFlow进阶指南:基础、算法与应用》
《深度学习框架PyTorch:入门与实践》
《21个项目玩转深度学习》
《基于TensorFlow的实践详解 》
最后
学习不在于多,而在于精,我们一天不要学太多,不要学习一些一知半解的知识。第四,形成学习的闭环,学习,复述,关联知识,运用。才能领悟DL学习的精髓!
回复 【idea激活】即可获得idea的激活方式
回复 【Java】获取java相关的视频教程和资料
回复 【SpringCloud】获取SpringCloud相关多的学习资料
回复 【python】获取全套0基础Python知识手册
回复 【2020】获取2020java相关面试题教程
回复 【加群】即可加入终端研发部相关的技术交流群
阅读更多
用 Spring 的 BeanUtils 前,建议你先了解这几个坑!
在华为鸿蒙 OS 上尝鲜,我的第一个“hello world”,起飞!
一款vue编写的功能强大的swagger-ui,有点秀(附开源地址)
相信自己,没有做不到的,只有想不到的
在这里获得的不仅仅是技术!
喜欢就给个“在看”