- 博客(10)
- 资源 (10)
- 收藏
- 关注
原创 强化学习论文笔记:Real-Time Reinforcement Learning
Real-time Reinforcement Learning简介NeurIPS 2019上蒙特利尔大学的工作在连续时间的决策任务中,环境在动作选择时是实时变化的。作者定义了实时马尔可夫决策过程(RTMDP)并提出强化学习算法Real-Time Actor-Critic(RTAC),相比于传统方法能够更好地学习实时环境下的最优策略问题存在动作选择延迟的连续时间马尔可夫环境下的实时决策问题方法智能体与环境的两种交互方式回合交互:串行,决...
2020-07-31 18:58:01 1265
原创 Solving Rubik's Cube with a Robot Hand:OpenAI训练机械手臂解魔方
说起《终结者》系列电影,我想最令人印象深刻的就是阿诺.施瓦辛格所饰演的T-800机器人,他那像人的手一样灵活的机械骨骼手臂可以说是相当的深入人心。继会玩DOTA的OpenAI Five后,人工智能研究组织OpenAI近日再次给了我们一个惊喜:他们的机器人已经学会使用一只机械手臂复原经典的三阶魔方。机械手臂是机械人技术领域中得到最广泛实际应用的自动化机械装置,在工业制造、医学治疗、娱乐服务、军事...
2020-04-11 17:32:08 1434
原创 强化学习论文笔记:Soft Actor Critic算法
无模型(model-free)的深度强化学习算法已经在一系列具有挑战性的决策制定和控制任务中得到了证明。然而,相比于基于模型(model-based)的算法,无模型算法通常面临两大挑战:非常高的样本复杂性和脆弱的收敛特性,这需要细致的超参数调优。这两个挑战严重限制了这些方法在复杂的现实世界领域的适用性。在这个框架中,参与者的目标是最大化期望的回报,同时最大化熵。也就是说,在完成任务的同时尽可能随机...
2020-04-10 20:13:41 3824
原创 AlphaGo是如何战胜人类的?这些机器学习知识不能不懂
机器学习是人工智能领域的热门研究话题。不论是在围棋上击败人类的AlphaGo,还是人脸识别系统,机器学习在诸多领域都取得了令人瞩目的成就。总的来说,机器学习让就是计算机具有像人一样的学习和思考能力的技术。具体方法就是从已知数据中获得规律,并利用规律对未知数据进行预测或理解。本文将以通俗易懂的方式解释机器学习中的术语,旨在为广大同学打下基础、培养兴趣,为以后的深入学习做准备。数据数据是机器学习的...
2019-08-01 10:25:33 780
原创 OpenAI Five:人工智能进化的新方向
近十年来,人工智能的研究人员们一直在尝试将游戏用作测试和评估人工智能系统的方法。得益于算法的发展和计算能力的增长,研究人员们开始寻求攻克越来越复杂的游戏,这些游戏拥有可以用来解决科学和现实问题所需的诸多要素。从最初的Atari游戏(乒乓球、打砖块),到后来的围棋和象棋,再到即时战略游戏星际争霸系列,人类正在一步一步地向通用人工智能迈进。
2019-08-01 10:21:47 1942
原创 探秘AlphaStar:星际争霸人工智能
(声明:此文已发表于《爱上机器人》2019年2月刊,转载请联系作者)前言 近十年来,人工智能的研究人员们一直在尝试将游戏用作测试和评估人工智能系统的方法。得益于算法的发展和计算能力的增长, 研究人员们开始寻求攻克越来越复杂的游戏,这些游戏拥有可以用来解决科学和现实问题所需的诸多要素。从最初的Atari游戏(乒乓球、打砖块),到后来的围棋和象棋,再到即时战略游戏星...
2019-04-15 21:15:04 6440 6
原创 星际争霸2人工智能初探——SC2LE研究环境搭建
##前言2017年5月28日,一场围棋界的世纪大战落下帷幕,人类棋手柯洁以0:3的比分负于人工智能AlphaGO。至此,人工智能攻破了千百年来人类智慧的最后防线——被称为”千古无重局“的围棋。标志着人工智能已迈向一个新的高度。同年8月10号,AlphaGO的创造者DeepMind公司宣布正式与暴雪公司展开合作,使用暴雪开发的传统电子竞技项目 星际争霸2 作为辅助人工智能学习提升的手段,并联合...
2018-09-27 21:02:58 2770 2
原创 JavaMail使用心得
JavaMail,顾名思义,提供给开发者处理电子邮件相关的编程接口。它是Sun发布的用来处理email的API。它可以方便地执行一些常用的邮件传输。我们可以基于JavaMail开发出类似于Microsoft Outlook的应用程序。在开发Java Web应用时经常用到它,注册帐号时的邮箱验证、通过邮箱找回密码、以及一些需要重新认证用户身份的操作都要通过发送邮件到用户邮箱中。虽然JavaMail是
2017-09-17 19:24:47 1664
原创 星际争霸:登录韩服等其他国家服务器
前言万众瞩目的星际争霸:重制版已于几周前隆重上线。除了原汁原味地保留了星际争霸1的游戏性外,暴雪的美工团队将原作中的单位和地图进行了尽可能细致的美化。重制版还支持缩放功能,你如今可以放大来细数刺蛇背后的针刺,重新渲染的地形也让画面表现更有深度和场景感,打开动态光照之后,白球的攻击特效可以在附近单位身上映出光影。此外,本次《星际争霸》高清重制版我们可以在游戏设置中选择简体中文与语音(配音与繁体台配有所
2017-09-15 20:15:06 19204 3
原创 学习笔记:阿里云ECS部署web项目的常见问题及解决方法
阿里云ECS部署web项目的常见问题及解决方法 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。 本次使用的ECS配置请参考云翼计划,操作系统镜像 CentOS 7.3 64位(更换系统盘的步骤和注意事项)一、使用PuTTY通过SSH连接到ECS时提示Disconnected通过
2017-09-10 17:33:08 823
国科大矩阵分析与应用课件.zip
2019-08-01
国科大计算机算法设计与分析18-19秋季.rar
2019-08-01
国科大数据挖掘18-19秋季.rar
2019-08-01
国科大图像处理与分析18-19秋季.rar
2019-08-01
国科大大数据系统与大规模数据分析18-19春季.rar
2019-08-01
国科大前沿可穿戴交互技术18-19夏季.rar
2019-08-01
国科大强化学习18-19春季.rar
2019-08-01
Reinforcement Learning-An Introduction.pdf
2019-07-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人