南方科技大学-香港中文大学(深圳)联合招收大模型算法实习生

来源:AI求职

单位与团队介绍

南方科技大学统计与数据科学系成立于2019年4月,以建设国际一流的教育培养和研究基地为目的。本系志在为国家培养出具有扎实的科学基础,思想活跃,创新意识和能力强,有国际视野,脚踏实地,有朝气、有理想的拔尖人才。本系已经建立起本硕博人才培养体系,拥有统计学和数据科学与大数据技术两个本科专业,及数学学科下概率论和数理统计硕博学位授予权,主要研究领域包括数理统计、生物医学统计、金融统计和数据科学。本目前共有17位教研序列教师和4位双聘教师,其中有讲席教授3人,教授4人,副教授6人,助理教授8人。统计系拥有国际化、高水平的师资队伍,包括1名国际数学家大会邀请报告人,2名国家自然科学奖二等奖获得者,1名长江讲座教授,2名国际数理统计学会(IMS)会士,1名IMS常务理事,1名美国统计学会(ASA)会士,1名IMS Medallion讲座演讲者,1名英国皇家统计学会会士、1名英国计算机学会会士,1名广东省特支科技创新青年拔尖人才,1名深圳市杰出人才培养对象,1名深圳市高层次国家级领军人才和2名深圳市优秀教师。

香港中文大学(深圳)数据科学学院师资团队现有62人(含兼职15人),其中校长学勤讲座教授4人、校长讲座教授10人、教授12人、副教授11人、助理教授23人、讲师1人。师资中包括加拿大皇家科学院和中国工程院外籍双院士1人、加拿大皇家科学院和加拿大工程院双院士1人、新加坡工程院院士1人、运筹学与管理学研究协会INFORMS会士1人、国际电气与电子工程学会IEEE会士4人、国际系统与控制科学院IASCYS 会士1人、国际数理统计学会IMS会士2人、美国工业与应用数学学会SIAM会士2人、国际语音通信学会ISCA会士1人、国家级高层次人才9人、省市区高层次人才7人。目前数据科学学院已录取的博士生均来自知名大学,如上海交通大学、浙江大学、南京大学、中国人民大学、中国科学技术大学、武汉大学、同济大学、香港中文大学(深圳)、南方科技大学等。本科专业包括数学与应用数学、计算机科学、信息科学、工业工程等。其中, 42%的学生本科成绩排名为专业前5%,80%的学生本科成绩排名为专业前10%。

42f7b1e4aaeb8d3e0187bf2e123975be.jpeg

导师简介

荆炳义教授,现任南方科技大学统计与数据科学系副系主任、讲席教授、南方科技大学大数据创新中心主任。于1993年在悉尼大学获得统计学博士学位,1992-1994 年在澳洲国立大学做博士后,师从国际著名统计学家Peter Hall 教授。1994-2021年在香港科技大学工作,任数学系教授、统计科学中心主任。荆炳义研究兴趣广泛,包括概率论与数理统计,金融计量及高频数据分析,机器学习理论与算法,生物信息,网络数据分析,强化学习等。他在各领域中有许多开创性研究,取得了很多突破性科研成果。共发表论文100余篇。荆炳义教授荣获2015年度国家自然科学奖二等奖, 教育部特聘教授,及两年度(2010,2015)获教育部高等学校自然科学奖二等奖。荆炳义教授是美国统计协会(ASA)和数理统计协会(IMS)会士(Fellow),国际统计学会(ISI)当选会士,泛华统计协会理事会成员,并先后分别担任七家国际期刊副主编。

2023年12月初,荆炳义教授课题组联合IDEA研究院发布34B Chat模型,具备超强多轮对话能力,在由美国Hugging Face社区支持的、致力于追踪、排名和评估大语言模型性能的开放大语言模型排行榜(Open LLM Leaderboard)中占据榜首,同时登顶上海AILab发布的Opencompass榜单同规模模型榜首,成为目前最具优势的开源34B指令微调模型之一。

个人主页:

https://faculty.sustech.edu.cn/?tagid=jingby&iscss=1&snapid=1&orderby=date&go=1

王本友,香港中文大学(深圳)助理教授,曾是欧盟玛丽居里研究员,于天津大学和意大利帕多瓦大学分别取得硕士和博士学位。主要研究方向为自然语言处理(NLP)、应用机器学习、和信息检索。曾在丹麦哥本哈根大学、加拿大蒙特利尔大学、荷兰阿姆斯特丹大学、华为诺亚方舟实验室、中科院理论物理所、社科院语言所交流访问。王本有助理教授曾获得国际信息检索顶级会议SIGIR 2017(CCF A类会议)最佳论文提名奖;博士期间获得国际NLP顶级会议NAACL 2019最佳可解释论文奖,该工作与NLP里程碑工作BERT同台领奖,长期担任ICLR/NeurIPS/ICML审稿人。发表包括国际顶级会议ICLR/NuerIPS/ACL/EMNLP/NAACL/  SIGIR/WWW和顶级期刊TOIS/TOC等20余篇,撰写的《推荐系统与深度学习》由清华大学出版社出版。

多模态大模型算法实习生

岗位职责

1. 参与多模态 (文本、图像、视频等) 大模型的研发和优化工作,协助进行模型的训练与调试;

2. 收集和处理多模态数据集,确保数据质量符合模型训练需求;

3. 协助团队进行相关算法的设计、训练和测试工作;

4. 追踪最新的人工智能研究进展,特别是多模态学习领域的前沿技术和应用。推进多模态大模型在业务场景的应用落地。‍

岗位要求

1. 正在就读于计算机科学、人工智能或相关专业的硕士或博士研究生;

2. 在计算机视觉、多模态理解等方面有扎实的研究基础,熟悉主流模型和算法,如CLIP、ALBEF、BEIT3、BLIP-2、LLaVA等多模态理解模型;

3. 具备良好的编程能力,熟练使用至少一种编程语言,如Python、Java或C++;

4. 对深度学习、机器学习有深入理解,有使用TensorFlow、PyTorch等深度学习框架的实战经验。熟悉分布式训练框架,如Megatron-LM和DeepSpeed,并具备多机多卡大模型训练经验者优先考虑;

5. 有高质量论文发表者优先 (如CVPR, AAAI, NIPS, ICLR, TPAMI, ICCV, ECCV等);

6. 有良好工程能力,在kaggle、天池等数据竞赛中获奖者优先;

7. 具有良好的英语读写能力,能够阅读和理解英文学术论文。

大语言模型算法实习生

岗位职责

1. 参与大语言模型在垂域的算法落地,根据业务需求开发定制化大语言模型,包括应用在AI Agent、虚拟对话、评论分析等业务场景;

2. 收集和处理垂域文本数据集,确保数据质量符合模型训练需求;

3. 负责提升大语言模型在检索增强、工具增强范式下的性能,提升检索和工具调用的准确度并降低内容生成的幻觉;

4. 参与深度学习和大语言模型研发相关工作,包括但不限于预训练、SFT、RLHF、Prompt调优、上下文窗口扩充、知识增强等。‍

岗位要求

1. 正在就读于计算机科学、人工智能或相关专业的硕士或博士研究生;

2. 在NLP、LLM等方面有扎实的研究基础,熟悉主流模型和算法,如LLaMA、Yi、Qwen等主流LLM的架构和MoE、LORA等主流训练技术;

3. 熟悉大语言模型的原理和训练方法,有实际训练经验者优先;

4. 对深度学习、机器学习有深入理解,有使用TensorFlow、PyTorch等深度学习框架的实战经验。熟悉分布式训练框架,如Megatron-LM和DeepSpeed,并具备多机多卡大模型训练经验者优先考虑;

5. 具备算法优化、模型量化、推理加速等工程能力和经验者优先;

6. 有高质量论文发表者优先 (如ICML, NIPS, ICLR, ACL, EMNLP等);

7. 有良好工程能力,在kaggle、天池等数据竞赛中获奖者优先。

深度学习框架研发实习生

岗位职责

1. 参与开发优化大模型训练框架,支持单任务千卡规模的高效和稳定训练;

2. 参与大语言模型、多模态大模型结构设计,并联合业务和校企合作进行模型训练效率和性能的验证;

3. 参与文生图和文生视频的训练性能加速;

4. 参与低精度训练性能优化和长窗口训练性能优化。‍

岗位要求

1. 熟悉使用PyTorch框架,可对DataLoader数据迭代和DDP训练代码进行性能分析和优化;

2. 熟练使用主流大模型训练框架DeepSpeed、Megatron、Colossal。掌握3D并行、ZeRO机制、Flash-Attnetion等原理和可优化方向。具有vLLM、llama.cpp等推理框架的研发经验;

3. 有ViT、Stable Diffusion、DiT模型训练性能优化经验者优先;

4. 熟练掌握CUDA性能优化手段,能够进行算子的拆分和融合,进行并行算法设计和优化,有算子编写优化项目经验者优先;

5. 有使用cutlass2/3进行深度学习相关算子开发,有复现接近cuBLAS效率kernel开发,有写过pytorch cuda extenti的优先。

福利待遇

1. 日薪350~500元(可覆盖在深生活开销,租房约1500元/月),可根据候选人的经验和技能水平确定薪资;

2. 优秀者可推荐攻读香港中文大学(深圳)数据科学哲学硕士/博士项目, 并提供最多全额的奖学金(与香港中文大学深圳的奖学金不冲突);

3. 实习期间提供计算资源、舒适的办公环境用于科学研究。

平台资源

1. 可为实习生提供南科大丰富优质的图书馆资源,AI和交叉学科领域拥有雄厚的师资力量;

2. 实习期间中心提供计算资源、舒适的办公环境用于科学研究;3. 可参与课题组科研项目,并可作为论文合作者;

4. 与华为、IDEA、UCloud、滴谱、鹏程实验室等有深度合作,也可提供内推机会。

申请方式

  • 邮箱:data@sustech.edu.cn

  • 电话:0755-88015665

推荐阅读

欢迎大家加入DLer-计算机视觉技术交流群!

大家好,群里会第一时间发布计算机视觉方向的前沿论文解读和交流分享,主要方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)

3e60f937613d56278ff353e7512c1511.jpeg

👆 长按识别,邀请您进群!

18aadca4d6abda22b14d59b96a987b67.gif

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值