Qwen 招聘：LLM Post-training方向

最新推荐文章于 2025-06-04 16:16:53 发布

LLM教程

最新推荐文章于 2025-06-04 16:16:53 发布

阅读量927

点赞数 7

文章标签：人工智能 embedding ai大模型大模型自然语言处理 LLM

本文链接：https://blog.csdn.net/AAI666666/article/details/142745268

版权

Qwen LLM Post-training方向招聘

Qwen 的 LLM Post-training目前正在积极招募新同学（不限校招 / 社招 / 实习）！Post-training的工作分为多个板块，其中包括通用能力、安全、Agent等方向。通用能力的优化包括 SFT 及 DPO 数据及训练研发，保证模型的基础能力，以及RLHF 相关研究提升模型上限，并探索模型的复杂推理能力；安全方面同样涉及 SFT 及 RLHF 部分，侧重提升模型的安全性，让我们的模型能力强大的同时安全可靠；Agent 方面研究在于从模型侧通过 Post-training 提升模型的 function call 、 Agent、角色扮演等重要能力，让我们的模型能和 Agent 框架有效结合，通过 Agent 的方式帮助用户解决真实世界的复杂问题。

工作职责

开展日常数据迭代实验，持续快速提升模型的基础能力，包括但不限于文本创作、逻辑推理、指令遵循、角色扮演、长序列、Agent、安全等能力
迭代Post-training训练策略，如模型蒸馏策略、MOE训练策略等
参与模型能力评测及评测数据和评估标准的迭代，持续跟进国内外最新测评和模型使用反馈
开展RLHF、Multi-Agent RL、Self-play RL等研究，提升Reward Signal丰富度和质量，并设计、执行和分析实验，从而提升模型能力上限，包括但不限于提升模型的逻辑推理、幻觉抵抗、人类偏好等能力
参与开发 Post-training所需工程框架开发，如 RLHF 框架、开源相关Post-training框架适配等
开发实验、研究、评测、内部部署相关的工具，帮助团队提升效率
从多模态多任务统一模型的角度思考，从底层优化到高层算法设计，为整个Qwen系列的工作作出贡献

要求

学历与计算机、机器学习等方向相关，博士及硕士优先
较强的代码能力，具有丰富的模型Post-training（SFT、DPO、PPO等）训练及相关数据处理经验
精通Python以及Pytorch等深度学习框架
熟悉Transformer架构以及大语言模型基础知识
善于平衡研究目标及落地实现，且结果导向
良好的沟通和合作能力
关注技术影响力，具有开源开放精神

加分项

曾发表顶级会议论文并具有一定的学术影响力，包括但不限于NeurIPS、ICLR、ICML、ACL、CVPR、ECCV、OSDI、SOSP等
具有大规模预训练实战经验
拥有知名开源项目，在开源社区具有较好的影响力

Base 地

北京 / 杭州 / 上海

联系方式

校招的同学可以直接投递简历（https://careers-tongyi.alibaba.com/campus/qrcode/apply/positions?code=AG73TKaxmlydmTfO9FY1fpkwDtIZNEb17KKvrSPgjtg=，

知乎没法放二维码）并邮件说明，社招和实习直接邮件联系我，junyang.ljy@alibaba-inc.com 。邮件最好撰写成以下形式，防止遗漏：

标题：【校招】姓名-方向（如果是实习或者社招，将“校招”二字修改即可）
简短自我介绍，以及希望应聘的方向和工作内容
附上简历，中英文均可。

加入我们

我们是一支热血且充满活力的团队，大家对打造最好的大模型充满热情。此外，我们是一支热爱开源的团队，你的技术贡献将会通过开源及产品的方式帮到这个世界的许多人，你的技术实力也能够被更多人看见。我们提供极具竞争力的薪资待遇，工作时间灵活，在这里你将充分感受到年轻与激情。快来加入我们，一起实现 AGI 理想！

如何系统的去学习大模型LLM ？

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

事实上，抢你饭碗的不是AI，而是会利用AI的人。

继科大讯飞、阿里、华为等巨头公司发布AI产品后，很多中小企业也陆续进场！超高年薪，挖掘AI大模型人才！ 如今大厂老板们，也更倾向于会AI的人，普通程序员，还有应对的机会吗？

与其焦虑……

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

但是LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高。

针对所有自学遇到困难的同学们，我帮大家系统梳理大模型学习脉络，将这份 LLM大模型资料 分享出来：包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程（LLaLA/Meta/chatglm/chatgpt）

在这里插入图片描述

LLM大模型学习路线 ↓

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
- L1.4.1 知识大模型
- L1.4.2 生产大模型
- L1.4.3 模型工程方法论
- L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
- L2.1.1 OpenAI API接口
- L2.1.2 Python接口接入
- L2.1.3 BOT工具类框架
- L2.1.4 代码示例
- L2.2 Prompt框架
- L2.3 流水线工程
- L2.4 总结与展望