强化学习是一种比较传统的人工智能手段,在近年来随着深度学习的发展,强化学习和深度学习逐渐结合在了一起。这种结合使得很多原来无法想象的工作有了可能,最令我们瞩目的莫过于AlphaGo战胜李世石,以及OpenAI团队的机器人可以在团战中战胜人类。这些技术都是非常尖端的技术,而这背后的原理其实有着非常朴实的一面。
为了对近年来逐渐升温的强化学习A3C技术以及强化学习整个的实现原理进行说明,我们邀请到了珠海金山软件AI工程组技术负责人高扬老师,他将在1月10日的公开课中深入浅出地讲解A3C强化学习。
▌课程信息
主题:深入浅出理解A3C强化学习
时间:1 月 10 日 20:00-21:00
地点:免费线上直播
报名&直播地址:https://edu.csdn.net/huiyiCourse/detail/939
▌分享嘉宾
高扬,珠海金山软件AI工程组技术负责人,前重庆工商大学研究生导师。曾任欢聚时代、金山软件西山居游戏工作室人工智能、大数据相关部门技术负责人,技术畅销书《白话大数据与机器学习》、《白话深度学习与Tensorflow》、《数据科学家养成手册》著书人。专注于人工智能产品的落地与实现。
▌适合对象
1、对强化学习感兴趣的工程师
2、有基本的机器学习算法理解的工程师
▌课程大纲
1、贯序决策(穷举搜索、蒙特卡罗方法)
2、DQN原理(时间差分法和Q-Learning、Deep Q-Learning Network)
3、A3C原理(异步方法的好处)
4、小恐龙网页游戏的训练方法
5、进阶资源推荐
▌课程安排
19:45—20:00 学员提前入场
20:00—20:50 讲师课程分享
20:50—21:00 讲师答疑环节
▌温馨提醒
1、开课前会有短信提醒或者邮件提醒,请报名的时候填写正确的手机号码及邮箱地址。
2、开课后 2-3 个工作日内会上传本节课的视频回放,报名后回放视频不限时观看。
▌加入社群
扫码添加小助手,回复:强化学习,加入 AI 科技大本营公开课分享交流群,嘉宾 PPT 及整理笔记将在直播结束后在群内公开。