学习笔记
文章平均质量分 81
浅唱丶
这个作者很懒,什么都没留下…
展开
-
强化学习论文笔记:Real-Time Reinforcement Learning
Real-time Reinforcement Learning简介NeurIPS 2019上蒙特利尔大学的工作在连续时间的决策任务中,环境在动作选择时是实时变化的。作者定义了实时马尔可夫决策过程(RTMDP)并提出强化学习算法Real-Time Actor-Critic(RTAC),相比于传统方法能够更好地学习实时环境下的最优策略问题存在动作选择延迟的连续时间马尔可夫环境下的实时决策问题方法智能体与环境的两种交互方式回合交互:串行,决...原创 2020-07-31 18:58:01 · 1293 阅读 · 0 评论 -
强化学习论文笔记:Soft Actor Critic算法
无模型(model-free)的深度强化学习算法已经在一系列具有挑战性的决策制定和控制任务中得到了证明。然而,相比于基于模型(model-based)的算法,无模型算法通常面临两大挑战:非常高的样本复杂性和脆弱的收敛特性,这需要细致的超参数调优。这两个挑战严重限制了这些方法在复杂的现实世界领域的适用性。在这个框架中,参与者的目标是最大化期望的回报,同时最大化熵。也就是说,在完成任务的同时尽可能随机...原创 2020-04-10 20:13:41 · 3903 阅读 · 0 评论 -
JavaMail使用心得
JavaMail,顾名思义,提供给开发者处理电子邮件相关的编程接口。它是Sun发布的用来处理email的API。它可以方便地执行一些常用的邮件传输。我们可以基于JavaMail开发出类似于Microsoft Outlook的应用程序。在开发Java Web应用时经常用到它,注册帐号时的邮箱验证、通过邮箱找回密码、以及一些需要重新认证用户身份的操作都要通过发送邮件到用户邮箱中。虽然JavaMail是原创 2017-09-17 19:24:47 · 1679 阅读 · 0 评论 -
学习笔记:阿里云ECS部署web项目的常见问题及解决方法
阿里云ECS部署web项目的常见问题及解决方法 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。 本次使用的ECS配置请参考云翼计划,操作系统镜像 CentOS 7.3 64位(更换系统盘的步骤和注意事项)一、使用PuTTY通过SSH连接到ECS时提示Disconnected通过原创 2017-09-10 17:33:08 · 828 阅读 · 0 评论