高性能计算工程师学习路线

黄冈大学

已于 2024-08-08 17:28:17 修改

阅读量1k

点赞数 23

文章标签：学习性能优化 python c++ git

于 2024-08-05 20:40:50 首次发布

本文链接：https://blog.csdn.net/m0_63058250/article/details/140936436

版权

注意：这条路线属于高性能计算工程师的初级阶段，中级阶段和高级阶段将在后续给出

BOSS直聘上高性能计算工程师年薪50W+岗位要求

1.小米

配合算法研究员完成算法的落地与部署工作，并在代码与指令集层面优化算法运行效率。
设计基于GPU的高性能算法基础库，支持下游各个算法研发。
职位要求
1、熟悉CUDA工作原理，能独立完成代码热点分析并制定优化方案。
2、良好的编程能力，熟悉python, c++，掌握常见的算法和数据结构知识；
3、良好的工程能力，有较强的的代码结构设计能力，熟练使用git、ssh，cmake等工具。
加分项
1、ACM/ICPC、CCPC、NOI、IOI等计算机/信息学竞赛获奖经历。

2.字节跳动

职位要求
1、精通C++，有良好的数据结构和算法基础，有3年以上高性能优化相关工作经验；
2、熟悉主流的并行编程以及性能优化技术，熟悉CUDA和tensorcore编程，有相关高性能优化经验优先；
3、熟悉TVM/MLIR/XLA等自动化编译技术的优先；
4、熟悉深度学习常用算法和模型结构，有CV/NLP/语言场景模型优化经验优先；
5、了解FasterTransformer模型推理优化框架优化；
6、有量化/稀疏化高性能优化经验优先；
7、了解Pytorch/Tensorflow/Paddle深度学习框架优先；

3.阿里

1、熟悉C/C++/Python，熟悉Linux/Unix开发环境
2、对计算机系统感兴趣，有计算相关的知识，有计算框架、异构计算、模型推理优化经验者优先，熟悉Nvidia GPU，cuda等生态者优先
3、对大规模高性能集群计算感兴趣，有集群任务管理、弹性调度、应用混部以及分布式计算等方面的经验者优先。
4、对新的AI技术感兴趣，包括LLM大语言模型、生成式CV/多模态模型等，有相关研发经验者优先。

4.vivo

1、本科及以上学历，微电子/计算机/电子等相关专业本科及以上学历背景，熟悉计算机体系结构知识；
2、熟悉编译器开发和优化，了解LLVM、TVM，熟悉视频、图像处理、计算机视觉的常见算法，熟悉并行编程（CUDA/OpenCL/OpenMP等）；
3、熟悉 CPU，GPU 或者 AI 加速器的硬件架构优先；
4、熟悉AI芯片架构、AI的网络模型等，具体低功耗芯片的设计经验优先；
5、了解渲染引擎、物理系统等相关技术的优先。

5.网易

职位要求

统招本科及以上学历
较好C/C++编程能力，熟悉常用数据结构
热爱技术，可以快速学习新技术
有以下一项或多项技术能力者优先

有GPU、NPU、ARM、或其他AI芯片等平台上应用开发优化经验
有算法引擎实现经验
熟悉深度学习网络的计算过程，了解主流的深度学习框架
熟悉TensorRT、MNN、NCNN、TVM、Mace、tflite等任一框架，有AI框架或算子开发经验更优

6.英伟达

【岗位要求】

计算机，电子等相关专业，硕士及以上学历。
熟悉C/C++编程，cuda kernel开发；
有底层算法性能调试及加速经验；
加分项：熟悉以下框架之一，VLM，TensorRT/TensorRT-LLM, xFormers。

7.拼多多

任职要求：
1、全日制本科及以上学历，计算机相关专业；
2、熟悉c/c++，熟悉算法和数据结构；
3、熟悉arm， x86等体系架构；
4、至少熟悉一种深度学习推理框架，比如 tnn，ternsorrt，openvino；
5、有并行加速经验者优先；
6、有深度学习编译器 tvm，xla开发经验等优先。

8.百度

职责要求：-有良好的编程基础，熟悉C/C++/Python，熟悉linux开发环境
加分项：-有深度学习框架(Pytorch, Tensorflow, PaddlePaddle等)使用经验优先-熟悉CUDA，OpenCL等高性能计算编程经验优先
-有视觉等应用系统优化经验优先
-有工程化落地部署经验的优先

9.360

学士及以上学历，计算机、电子、自动化等相关专业；
熟悉Python，熟悉C/C++编程，编程能力优秀；
熟练掌握TensorFlow/PyTorch等至少一种深度学习框架；
熟练掌握TensorRT, XLA, TVM等深度学习编译器，能够基于这些编译器做二次开发或者加速应用；
熟悉GPU等硬件架构，精通CUDA、cuDNN、NCCL，熟悉RDMA，Nvlink等互联技术；
熟悉模型并行，数据并行，流水并行等分布式训练加速的基本原理；
熟悉业界常见的分布式训练解决方案，例如Megatron， DeepSpeed等；
有相关的项目背景优先。

10.boss直聘

岗位要求：

熟练掌握计算机体系结构基础知识，精通C++/Python，熟悉CUDA/MKL/OneTBB/OneDNN编程。
熟悉深度学习框架TF/Pytorch/ONNX，了解深度学习常用模型和算法加分。
有算子开发经验，具备深度学习模型性能分析和优化能力。
熟悉图优化、混合精度、剪枝、编译优化技术，有实操业务落地经验加分。
熟悉开源项目Triton、OpenVINO加分。

总结

针对高性能计算（HPC）岗位的要求，下面是一份详细的学习路线，可以帮助你达到上述公司所列出的岗位需求：

第一部分：基础知识

计算机科学基础
- 数据结构与算法
- Linux系统编程
- Linux网络编程
- 计算机体系结构
编程语言
- 精通 C/C++
- 熟悉 Shell

第二部分：高性能计算与并行编程

GPU 编程
- CUDA
并行编程
- OpenMP
深度学习框架
- TensorFlow
模型优化与编译
- TVM

第三部分：数学与数值方法

数学与统计
- 数值分析

第四部分：深度学习与AI

深度学习模型与算法
- OpenCV
高性能推理框架
- TensorRT

第五部分：硬件与体系结构

CPU 架构
- ARM
- x86
GPU 架构
- Nvidia GPU 架构
AI 加速器
- NPU
- TPU
AI 芯片设计
- 低功耗芯片设计

第六部分：工程实践与工具

版本控制
- Git
构建工具
- CMake
工程化
- 性能分析与优化
- 算子开发
- 系统部署

第七部分：分布式计算与集群管理

集群与分布式系统
- 集群任务管理
- 弹性调度
- 分布式计算
分布式训练
- 模型并行
- 数据并行
- 流水线并行
- Megatron, DeepSpeed 等分布式训练解决方案

注意：这条路线属于高性能计算工程师的初级阶段，中级阶段和高级阶段将在后续给出
这条路线需要长期投入和持续学习，建议根据个人兴趣和可用资源来调整学习计划。同时，保持关注最新的技术动态和行业趋势，以便随时更新你的技能树。

黄冈大学

关注

23
点赞
踩
9

收藏

觉得还不错? 一键收藏
2
评论
高性能计算工程师学习路线

职位要求1、精通C++，有良好的数据结构和算法基础，有3年以上高性能优化相关工作经验；2、熟悉主流的并行编程以及性能优化技术，熟悉CUDA和tensorcore编程，有相关高性能优化经验优先；3、熟悉TVM/MLIR/XLA等自动化编译技术的优先；4、熟悉深度学习常用算法和模型结构，有CV/NLP/语言场景模型优化经验优先；5、了解FasterTransformer模型推理优化框架优化；6、有量化/稀疏化高性能优化经验优先；7、了解Pytorch/Tensorflow/Paddle深度学习框架
复制链接

扫一扫