如果能天天送书,天天爽就好了,再送5本

送书福利再度来袭,前几天刚送了5本,今天小编带来了一份非常不错的Python入门书,非常感谢机械出版社的大力支持。这次我们送出的是《强化学习原理与Python实现》5本书,一起来看一下。




640


本书是国内第一本基于TensorFlow2实现的算法,现在在【华章鲜读】购买本书鲜读专栏享受7折优惠62.3元(原价89元),不仅可以入库即刻发货得到作者签名版(先到先得),还可以在鲜读平台向作者提问,和鲜友交流。



01.

下面是一些书评


提前阅读本书的鲜友写的豆瓣书评(这个是链接,大家也可以根据自己的需求字节截取

https://book.douban.com/subject/34478302/)

640


640


640


强化学习正在改变人类社会的方方面面:基于强化学习的游戏AI已经在围棋、星际争霸等游戏上战胜人类顶尖选手,基于强化学习的控制算法已经运用于机器人、无人机等设备,基于强化学习的交易算法已经部署在金融平台上并取得超额收益。由于同一套强化学习代码在使用同一套参数的情况下能解决多个看起来毫无关联的问题,所以强化学习常被认为是迈向通用人工智能的重要途径。在此诚邀相关专业人士研究强化学习,以立于人工智能的时代之巅。


02.

内容梗概


本书介绍强化学习理论及其Python实现,全书分为三个部分:


  • 第1章:介绍强化学习的基础知识与环境库Gym的使用,并给出一个完整的编程实例。

  • 第2~9章:介绍强化学习的理论和算法。采用严谨的数学语言,推导强化学习的基本理论,进而在理论的基础上讲解算法,并为算法提供配套的Python实现。算法的讲解和Python实现逐一对应,覆盖了所有主流的强化学习算法。

  • 第10~12章:介绍多个综合案例,包括电动游戏、棋盘游戏和自动驾驶。环境部分涵盖Gym库的完整安装和自定义扩展,也包括Gym库以外的环境。算法部分涵盖了《自然》 《科学》等权威期刊发表的多个深度强化学习明星算法。


03.

本书特色


本书完整地介绍了主流的强化学习理论。全书采用完整的数学体系,各章内容循序渐进,严谨地讲授强化学习的理论基础,主要定理均给出证明过程。基于理论讲解强化学习算法,覆盖了所有主流强化学习算法,包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算法。

全书采用一致的数学符号,并且与权威强化学习教程(如R. Sutton等的《Reinforce-ment Learning: An Introduction(第2版)》和D. Silver的视频课程)完美兼容。

本书各章均提供Python代码,实战性强。


全书代码统一规范,基于最新的Python 3.7(兼容Python 3.6)、Gym 0.12和TensorFlow 2(兼容TensorFlow 1)实现强化学习算法。所有代码在Windows、macOS和Linux三大操作系统上均可运行,书中给出了环境的安装和配置方法,涉及环境全面。


第1~9章提供算法的配套实现,强化学习环境只依赖于Gym的最小安装,使理论学习免受环境安装困扰;第10~12章的综合案例既涵盖Gym库的完整安装和自定义扩展,还包括Gym库以外的环境,让读者体验更加复杂的强化学习任务。

全书实现对硬件配置要求低。第1~9章代码在没有GPU的计算机上也可运行;第10~12章代码在配置普通GPU的计算机上即可运行。


赠书方法:

为了把书给更多真正玩Python的同学,这次送书我们设定了一个的小门槛,回答出这道很简单的Python题目的同学,可以参与抽奖!


简单题目:

3124是数字1,2,3和4的一种可能的排列。如果所有排列都以数字或字母顺序进行列出,我们称之为词典顺序。比如0,1,2 的字典排列是:012 021 102 120 201 210

那么0,1,2,3,4,5,6,7,8,9的字典排列第1百万个数字是多少?


小提示:第1百万其实是列表里面的第999999



答案是一个很长的数字,大家把答案写出来,写在公众号后台,公众号后台,公众号后台答对的即可抽奖! 公众号后台 如下)

640?wx_fmt=jpeg



开奖的时间是7/24 晚上20:00,大家有几天的时间答题。


另外上次送书,还有一位小伙伴"Jinfeng"没有在抽奖助手上填快递信息,尽快哈!截止时间7/23 12:00!

640?wx_fmt=jpeg



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值