强化学习
小宋是呢
作者简介:深度学习开发分享博主。全网粉丝3W+,阅读量200W+。
CSDN深度学习博客专家以及微信公众号《简明AI》主要作者。创作内容是基于深度学习的理论学习与应用开发技术分享,致力于最简单明了AI技术分享与最实用AI应用教程。
撰写并发表深度学习论文两篇,获得国家级及省级一等奖奖项八次,以第一作者授权实用新型及发明专利共计十余项,天池与BDCI比赛Top10奖项数次。
在某公司担任算法工程师,从事计算机视觉及时序序列数据的检测识别;深度学习工程化经验丰富,擅长针对新算法研究与应用,包括对模型调优、模型转化及多平台部署等。
展开
-
[TensorFlow强化学习入门]实战一·使用Python原生编写Q-Learning算法
[TensorFlow强化学习入门]实战一·使用Python原生编写Q-Learning算法 参考学习地址 测试代码: import numpy as np import pandas as pd import time N_STATES = 6 # 1维世界的宽度 ACTIONS = ['left', 'right'] # 探索者的可用动作 EPSILON = 0.9 # 贪婪...原创 2018-12-13 17:33:21 · 1420 阅读 · 1 评论 -
[深度学习工具]·百度PaddlePaddle深度强化学习框架PARL
PARL快速入门示例 PaddlePaddle PARL 的名字来源于 PAddlepaddle Reinfocement Learning,是一款基于百度 PaddlePaddle 打造的深度强化学习框架。PaddlePaddle PARL 凝聚了百度多年来在强化学习领域的技术深耕和产品应用经验。与现有强化学习工具和平台相比,PaddlePaddle PARL 具有更高的可扩展性、可复现性和可...原创 2019-01-19 00:09:31 · 2747 阅读 · 0 评论