注意:这条路线属于高性能计算工程师的初级阶段,中级阶段和高级阶段将在后续给出
BOSS直聘上高性能计算工程师年薪50W+岗位要求
1.小米
- 配合算法研究员完成算法的落地与部署工作,并在代码与指令集层面优化算法运行效率。
- 设计基于GPU的高性能算法基础库,支持下游各个算法研发。
职位要求
1、熟悉CUDA工作原理,能独立完成代码热点分析并制定优化方案。
2、良好的编程能力,熟悉python, c++,掌握常见的算法和数据结构知识;
3、良好的工程能力,有较强的的代码结构设计能力,熟练使用git、ssh,cmake等工具。
加分项
1、ACM/ICPC、CCPC、NOI、IOI等计算机/信息学竞赛获奖经历。
2.字节跳动
职位要求
1、精通C++,有良好的数据结构和算法基础,有3年以上高性能优化相关工作经验;
2、熟悉主流的并行编程以及性能优化技术,熟悉CUDA和tensorcore编程,有相关高性能优化经验优先;
3、熟悉TVM/MLIR/XLA等自动化编译技术的优先;
4、熟悉深度学习常用算法和模型结构,有CV/NLP/语言场景模型优化经验优先;
5、了解FasterTransformer模型推理优化框架优化;
6、有量化/稀疏化高性能优化经验优先;
7、了解Pytorch/Tensorflow/Paddle深度学习框架优先;
3.阿里
1、熟悉C/C++/Python,熟悉Linux/Unix开发环境
2、对计算机系统感兴趣,有计算相关的知识,有计算框架、异构计算、模型推理优化经验者优先,熟悉Nvidia GPU,cuda等生态者优先
3、对大规模高性能集群计算感兴趣,有集群任务管理、弹性调度、应用混部以及分布式计算等方面的经验者优先。
4、对新的AI技术感兴趣,包括LLM大语言模型、生成式CV/多模态模型等,有相关研发经验者优先。
4.vivo
1、本科及以上学历,微电子/计算机/电子等相关专业本科及以上学历背景,熟悉计算机体系结构知识;
2、熟悉编译器开发和优化,了解LLVM、TVM,熟悉视频、图像处理、计算机视觉的常见算法,熟悉并行编程(CUDA/OpenCL/OpenMP等);
3、熟悉 CPU,GPU 或者 AI 加速器的硬件架构优先;
4、熟悉AI芯片架构、AI的网络模型等,具体低功耗芯片的设计经验优先;
5、了解渲染引擎、物理系统等相关技术的优先。
5.网易
职位要求
- 统招本科及以上学历
- 较好C/C++编程能力,熟悉常用数据结构
- 热爱技术,可以快速学习新技术
- 有以下一项或多项技术能力者优先
- 有GPU、NPU、ARM、或其他AI芯片等平台上应用开发优化经验
- 有算法引擎实现经验
- 熟悉深度学习网络的计算过程,了解主流的深度学习框架
- 熟悉TensorRT、MNN、NCNN、TVM、Mace、tflite等任一框架,有AI框架或算子开发经验更优
6.英伟达
【岗位要求】
- 计算机,电子等相关专业,硕士及以上学历。
- 熟悉C/C++编程,cuda kernel开发;
- 有底层算法性能调试及加速经验;
- 加分项:熟悉以下框架之一,VLM,TensorRT/TensorRT-LLM, xFormers。
7.拼多多
任职要求:
1、全日制本科及以上学历,计算机相关专业;
2、熟悉c/c++,熟悉算法和数据结构;
3、熟悉arm, x86等体系架构;
4、至少熟悉一种深度学习推理框架,比如 tnn,ternsorrt,openvino;
5、有并行加速经验者优先;
6、有深度学习编译器 tvm,xla开发经验等优先。
8.百度
职责要求:-有良好的编程基础,熟悉C/C++/Python,熟悉linux开发环境
加分项:-有深度学习框架(Pytorch, Tensorflow, PaddlePaddle等)使用经验优先-熟悉CUDA,OpenCL等高性能计算编程经验优先
-有视觉等应用系统优化经验优先
-有工程化落地部署经验的优先
9.360
- 学士及以上学历,计算机、电子、自动化等相关专业;
- 熟悉Python,熟悉C/C++编程,编程能力优秀;
- 熟练掌握TensorFlow/PyTorch等至少一种深度学习框架;
- 熟练掌握TensorRT, XLA, TVM等深度学习编译器,能够基于这些编译器做二次开发或者加速应用;
- 熟悉GPU等硬件架构,精通CUDA、cuDNN、NCCL,熟悉RDMA,Nvlink等互联技术;
- 熟悉模型并行,数据并行,流水并行等分布式训练加速的基本原理;
- 熟悉业界常见的分布式训练解决方案,例如Megatron, DeepSpeed等;
- 有相关的项目背景优先。
10.boss直聘
岗位要求:
- 熟练掌握计算机体系结构基础知识,精通C++/Python,熟悉CUDA/MKL/OneTBB/OneDNN编程。
- 熟悉深度学习框架TF/Pytorch/ONNX,了解深度学习常用模型和算法加分。
- 有算子开发经验,具备深度学习模型性能分析和优化能力。
- 熟悉图优化、混合精度、剪枝、编译优化技术,有实操业务落地经验加分。
- 熟悉开源项目Triton、OpenVINO加分。
总结
针对高性能计算(HPC)岗位的要求,下面是一份详细的学习路线,可以帮助你达到上述公司所列出的岗位需求:
第一部分:基础知识
-
计算机科学基础
- 数据结构与算法
- Linux系统编程
- Linux网络编程
- 计算机体系结构
-
编程语言
- 精通 C/C++
- 熟悉 Shell
第二部分:高性能计算与并行编程
-
GPU 编程
- CUDA
-
并行编程
- OpenMP
-
深度学习框架
- TensorFlow
-
模型优化与编译
- TVM
第三部分:数学与数值方法
- 数学与统计
- 数值分析
第四部分:深度学习与AI
-
深度学习模型与算法
- OpenCV
-
高性能推理框架
- TensorRT
第五部分:硬件与体系结构
-
CPU 架构
- ARM
- x86
-
GPU 架构
- Nvidia GPU 架构
-
AI 加速器
- NPU
- TPU
-
AI 芯片设计
- 低功耗芯片设计
第六部分:工程实践与工具
-
版本控制
- Git
-
构建工具
- CMake
-
工程化
- 性能分析与优化
- 算子开发
- 系统部署
第七部分:分布式计算与集群管理
-
集群与分布式系统
- 集群任务管理
- 弹性调度
- 分布式计算
-
分布式训练
- 模型并行
- 数据并行
- 流水线并行
- Megatron, DeepSpeed 等分布式训练解决方案
注意:这条路线属于高性能计算工程师的初级阶段,中级阶段和高级阶段将在后续给出
这条路线需要长期投入和持续学习,建议根据个人兴趣和可用资源来调整学习计划。同时,保持关注最新的技术动态和行业趋势,以便随时更新你的技能树。