![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
春实习
文章平均质量分 78
oldxacorn
这个作者很懒,什么都没留下…
展开
-
2021春实习系列 ------字节跳动
字节朝夕光年游戏部门:强化学习算法工程师 投了了字节,还在准备就收到了面试邀约,然后就挂了 T_T,进大厂还是得好好准备一下 面试问题: 自我介绍 项目细节 项目中智能体如何感知环境 DDPG算法细节以及一些关键的伪代码 DDPG改进算法 Soft Actor-Critic算法? Soft Actor-Critic (SAC)是面向Maximum Entropy Reinforcement learning 开发的一种off policy算法,和DDPG相比,Soft Actor-C原创 2021-10-01 22:20:47 · 130 阅读 · 0 评论 -
2021春实习系列------西山居游戏
2021年3月多投了一些公司的实习,想增加一下自己的能力,下面整理一下当时的面试,希望给后面的人一些帮助。 本人本科学的控制,研究所主要方向是强化学习,所以主要是投递强化学习方向的岗位。 强化学习中主要在工业界的应用就说游戏,游戏AI的训练就投递了 西山居游戏「【校招】强化学习算法工程师」 下面是面试当时的问题不完全整理: 自我介绍 介绍AC算法 A2C, A3C做了哪些升级 A2C全称为优势动作评论算法(Advantage Actor ...原创 2021-10-01 21:54:50 · 370 阅读 · 0 评论