2021春实习系列 ------字节跳动

字节朝夕光年游戏部门:强化学习算法工程师

投了了字节,还在准备就收到了面试邀约,然后就挂了 T_T,进大厂还是得好好准备一下

面试问题:

  1. 自我介绍
  2. 项目细节
  3. 项目中智能体如何感知环境
  4. DDPG算法细节以及一些关键的伪代码
  5. DDPG改进算法
  6. Soft Actor-Critic算法?
    1. Soft Actor-Critic (SAC)是面向Maximum Entropy Reinforcement learning 开发的一种off policy算法,和DDPG相比,Soft Actor-Critic使用的是随机策略stochastic policy,相比确定性策略具有一定的优势

    2.  

编程题

 岛屿问题

class Solution:

    def dfs(self, grid, r, c):

        grid[r][c] = 0

        nr, nc = len(grid), len(grid[0])

        for x, y in [(r+1, c), (r-1, c), (r, c+1), (r, c-1)]:

            if 0 <= x < nr and 0 <= y < nc and grid[x][y] == '1':

                self.dfs(grid, x, y)

    def numIslands(self, grid: List[List[str]]) -> int:

        nr = len(grid)

        if nr == 0:

            return 0

        nc = len(grid[0])

        numIslands = 0

        for r in range(nr):

            for c in range(nc):

                if grid[r][c] == '1':

                    numIslands += 1

                    self.dfs(grid, r, c)

        return numIslands

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值