纯干货11 强化学习(Reinforcement Learning)教材推荐


之前,给大家推荐了两套强化学习视频教程。

纯干货10 强化学习视频教程分享(从入门到精通)

今天给大家推荐两本关于强化学习的教程。第一本 《Reinforcement Learning An Introduction》 Richard S. Sutton and Andrew G. Barto。 Sutton在2012年Release出来的,更新之后的第二版。应该算是目前为止,关于强化学习,介绍最为详细,全面的教材之一。David Silver的强化学习视频也是根据这本教材展开,配合着看,更容易理解。

链接: pan.baidu.com/s/1dF1Uqs

密码: 公众号回复“br1”


第二本 《Algorithms for Reinforcement Learning》,Csaba Szepesvri于2009年,发表于《Synthesis Lectures on Articial Intelligence and Machine Learning》上的一篇手稿。与第一本相比,这本书短小简洁,省去了很多公式推理,适合想要快速了解强化学习算法的朋友。

链接: pan.baidu.com/s/1dFF134

密码: 公众号回复“br2”


往期内容推荐

优化策略5 Label Smoothing Regularization_LSR原理分析

模型汇总16 各类Seq2Seq模型对比及《Attention Is All You Need》中技术详解

<模型汇总-10> Variational AutoEncoder_变分自动编码器原理解析

<模型汇总-9> VAE基础:LVM、MAP、EM、MCMC、Variational Inference(VI)

更多深度学习NLP方面应用的经典论文、实践经验和最新消息,欢迎关注微信公众号“深度学习NLPDeepLearning_NLP”或扫描二维码添加关注。


评论 31
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lqfarmer

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值