Qwen 招聘:LLM Post-training方向

Qwen LLM Post-training方向招聘

Qwen 的 LLM Post-training目前正在积极招募新同学(不限 校招 / 社招 / 实习)!Post-training的工作分为多个板块,其中包括通用能力、安全、Agent等方向。通用能力的优化包括 SFT 及 DPO 数据及训练研发,保证模型的基础能力,以及RLHF 相关研究提升模型上限,并探索模型的复杂推理能力;安全方面同样涉及 SFT 及 RLHF 部分,侧重提升模型的安全性,让我们的模型能力强大的同时安全可靠;Agent 方面研究在于从模型侧通过 Post-training 提升模型的 function call 、 Agent、角色扮演等重要能力,让我们的模型能和 Agent 框架有效结合,通过 Agent 的方式帮助用户解决真实世界的复杂问题。

工作职责

  • 开展日常数据迭代实验,持续快速提升模型的基础能力,包括但不限于文本创作、逻辑推理、指令遵循、角色扮演、长序列、Agent、安全等能力
  • 迭代Post-training训练策略,如模型蒸馏策略、MOE训练策略等
  • 参与模型能力评测及评测数据和评估标准的迭代,持续跟进国内外最新测评和模型使用反馈
  • 开展RLHF、Multi-Agent RL、Self-play RL等研究,提升Reward Signal丰富度和质量,并设计、执行和分析实验,从而提升模型能力上限,包括但不限于提升模型的逻辑推理、幻觉抵抗、人类偏好等能力
  • 参与开发 Post-training所需工程框架开发,如 RLHF 框架、开源相关Post-training框架适配等
  • 开发实验、研究、评测、内部部署相关的工具,帮助团队提升效率
  • 从多模态多任务统一模型的角度思考,从底层优化到高层算法设计,为整个Qwen系列的工作作出贡献

要求

  • 学历与计算机、机器学习等方向相关,博士及硕士优先
  • 较强的代码能力,具有丰富的模型Post-training(SFT、DPO、PPO等)训练及相关数据处理经验
  • 精通Python以及Pytorch等深度学习框架
  • 熟悉Transformer架构以及大语言模型基础知识
  • 善于平衡研究目标及落地实现,且结果导向
  • 良好的沟通和合作能力
  • 关注技术影响力,具有开源开放精神

加分项

  • 曾发表顶级会议论文并具有一定的学术影响力,包括但不限于NeurIPS、ICLR、ICML、ACL、CVPR、ECCV、OSDI、SOSP等
  • 具有大规模预训练实战经验
  • 拥有知名开源项目,在开源社区具有较好的影响力

Base 地

北京 / 杭州 / 上海

联系方式

校招的同学可以直接投递简历(https://careers-tongyi.alibaba.com/campus/qrcode/apply/positions?code=AG73TKaxmlydmTfO9FY1fpkwDtIZNEb17KKvrSPgjtg=,

知乎没法放二维码)并邮件说明,社招和实习直接邮件联系我,junyang.ljy@alibaba-inc.com 。邮件最好撰写成以下形式,防止遗漏:

  • 标题:【校招】姓名-方向 (如果是实习或者社招,将“校招”二字修改即可)
  • 简短自我介绍,以及希望应聘的方向和工作内容
  • 附上简历,中英文均可。

加入我们

我们是一支热血且充满活力的团队,大家对打造最好的大模型充满热情。此外,我们是一支热爱开源的团队,你的技术贡献将会通过开源及产品的方式帮到这个世界的许多人,你的技术实力也能够被更多人看见。我们提供极具竞争力的薪资待遇,工作时间灵活,在这里你将充分感受到年轻与激情。快来加入我们,一起实现 AGI 理想!

如何系统的去学习大模型LLM ?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

事实上,抢你饭碗的不是AI,而是会利用AI的人。

科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

与其焦虑……

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。

针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程(LLaLA/Meta/chatglm/chatgpt)

在这里插入图片描述

LLM大模型学习路线

阶段1:AI大模型时代的基础理解

  • 目标:了解AI大模型的基本概念、发展历程和核心原理。

  • 内容

    • L1.1 人工智能简述与大模型起源
    • L1.2 大模型与通用人工智能
    • L1.3 GPT模型的发展历程
    • L1.4 模型工程
    • L1.4.1 知识大模型
    • L1.4.2 生产大模型
    • L1.4.3 模型工程方法论
    • L1.4.4 模型工程实践
    • L1.5 GPT应用案例

阶段2:AI大模型API应用开发工程

  • 目标:掌握AI大模型API的使用和开发,以及相关的编程技能。

  • 内容

    • L2.1 API接口
    • L2.1.1 OpenAI API接口
    • L2.1.2 Python接口接入
    • L2.1.3 BOT工具类框架
    • L2.1.4 代码示例
    • L2.2 Prompt框架
    • L2.3 流水线工程
    • L2.4 总结与展望

阶段3:AI大模型应用架构实践

  • 目标:深入理解AI大模型的应用架构,并能够进行私有化部署。

  • 内容

    • L3.1 Agent模型框架
    • L3.2 MetaGPT
    • L3.3 ChatGLM
    • L3.4 LLAMA
    • L3.5 其他大模型介绍

阶段4:AI大模型私有化部署

  • 目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。

  • 内容

    • L4.1 模型私有化部署概述
    • L4.2 模型私有化部署的关键技术
    • L4.3 模型私有化部署的实施步骤
    • L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值