阿里巴巴——机器学习面试总结

目录

一面

二面

三面

四面交叉面

HR面


一面


60分钟左右,聊得最开心的一位面试官,感觉二面没有挂掉应该是他给的评价比较好吧。

谈一下论文主要思想
介绍论文里不平衡分类马尔科夫决策过程的状态、动作、回报函数设计以及状态转移过程
针对状态转移的有效性、合理性和严谨性讨论了很久
讨论强化学习解决分类问题和监督学习下的神经网通分类器的异同
谈谈传统不平衡分类算法(上采样、下采样、混合采样、代价敏感矩阵、调整分类器阈值)以及最新深度学习不平衡分类算法
分析论文所提算法对比其他方法的优劣点
谈一下外汇自动交易项目的主要工作
介绍外汇自动交易项目里马尔科夫决策过程的状态、动作、回报函数设计以及状态转移过程
Q-网络的结构如何设计
LSTM和CNN提取时序价格数据特征的异同点
模型性能如何评价
在真正外汇环境里算法表现得怎么样(训练数据上效果很好,在未知的现实数据中还是难以捕捉市场规律)
讲一下DQN算法以及几种改进版本(Rainbow)
DQN算法与策略梯度算法的差别
REINFORCE算法存在问题,如何改进
Actor-Critic算法实现的细节
PPO算法的思想及其损失函数
on-policy与off-policy的区别
最后一道简单编程题结束,在旋转数组(5 5 6 7 1 2 3 4 4)中查找一个数(log N),几分钟写完后问了一下他所在的部门,实习生主要的工作,base杭州和深圳的区别,总共几面

二面


25号中午终于接到二面电话&#x

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

fpga和matlab

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值