NVIDIA中国计算架构团队正在招聘实习生!
大家熟知的cuDNN、TensorRT,到MLPerf、Myelin…这些业界耳熟能详的软件库,都集成了无数计算架构团队伙伴们的智慧。在这里,大家关注NVIDIA每一代产品的架构,构思软硬件协同的解决方案,分析最前沿AI模型在NVIDIA产品上的性能,探索下一代产品及架构的无限可能。在这支积极、快乐、昂扬的团队中,我们传播的智慧不仅会灌溉NVIDIA,更会反过来滋养我们一生的眼界与道路。
实习团队介绍:
此实习岗位将在每周五统一笔试,笔试时会提供第一、二志愿进行选择,请提前了解以下实习团队。目前NVIDIA中国计算架构团队分为4个方向,分别是:
1. Fast Kernel算子库团队
专注于挖掘深度学习算子的性能极限,结合GPU架构设计和开发高度优化的GPU算子库。
2. TensorRT团队
专注于开发跨平台、高性能的深度学习推理软件,优化TensorRT推理引擎。
3. TensorRT-LLM团队
致力于优化大模型推理性能,与跨领域的团队合作开发创新的推理加速方案。探索混合精度、稀疏矩阵、量化等算法层面的优化方向。
4. 架构团队
探索下一代GPU架构,搭建性能分析和预测的基础设施,评估新的微架构特性,分析前沿的AI编译器和软件栈,为未来的GPU研发提供方向。
职位要求:(以下任一即可)
• 出色的C/C++/Python编程和软件设计技能
• 了解深度学习(如大语言模型、生成模型和推荐模型)的最新发展