决策算法(reinforcemet learning的头部)强化学习

工作职责

  1. 承担自动驾驶产品中行为决策、运动规划、语义地图构建、知识表示等相关业务组件的设计、实现和测试;
  2. 调研规划决策领域知识,跟进业界和学界的进展,研发决策规划相关算法,进行平台算法组件的 开发;
  3. 依据业务需求,设计算法指标和场景数据,并依据指标和场景数据评判算法效果;
  4. 遵循系统工程和软件工程实践,依照开发流程进行团队协作,提高研发效率和质量。
    任职要求
  5. 自动化、计算机、数学相关专业硕士学历以上;
  6. 具有良好的技术热情和团队协作能力;
  7. 熟悉C/C++,具有良好的编程能力;
  8. 良好的数学、算法和逻辑能力,熟悉计算复杂度分析、机器人建模和不确定性建模;
  9. 熟常见的机器人软件开发方法(OOP、单元测试、CI/CD)和工具(Linux、Git、Bash、UML);
  10. 熟悉下列领域至少两个:
    a. Convex optimitization,numerical optimization,operation research;
    b. Seach-based planning and dynamic programming,A*,D*,Hybrid A*;
    c. POMDP/MDP-based approaches;
    d. Model-based/free reinforcement learning,inverse reinforecement learning;
    e. Probabilistic graphic model,including factor graph,bayesian network,conditional random field;
    f. Modern control approaches,especially optimal control;
    g. Automatic logic representation/inference;
    加分项:
  11. 在IJRR、TRO、JFR、RSS、IROS、IV等顶级机器人学刊物和会议发表过文章;
  12. 有自动驾驶系统或ADAS系统决策规划相关项目开发经验;
  13. 有ACM/ICPC、CCPC、 Robocon、智能车挑战赛等参赛经验。

欢迎诸位好友自荐和推荐,谢谢

薪酬无上限

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值