- 博客(4)
- 收藏
- 关注
原创 三.深度学习框架
• ONNX(Open Neural Network Exchange):跨框架模型格式标准,非训练框架,核心用于将PyTorch/TensorFlow模型转换为统一格式,适配不同部署环境(如PyTorch模型转ONNX后,可在TensorRT或移动端部署)。• 优势:算力效率极高(适配TPU优化),支持函数式编程,适合超大规模模型(如大语言模型、扩散模型)研发,灵活性远超传统框架。• 定位:工业级首选,通用性极强,适配全场景部署(服务器、移动端、边缘端、嵌入式)。
2025-12-11 05:55:58
394
原创 二.编译器和代码优化技术
编译器是将高级编程语言(如C、C++、Java、Python)编写的源代码,转化为计算机可直接执行的机器语言(或字节码、中间代码)的程序,核心价值是“翻译+优化”,让代码能高效在硬件上运行。词法分析:拆分源代码为最小语法单元(如关键字、变量名、运算符,称为“Token”),比如把int a=1+2;拆为inta12;。语法分析:基于Token构建抽象语法树(AST),校验语法合法性(如是否漏写分号、括号不匹配),AST是源代码的结构化表示,便于后续处理。语义分析。
2025-12-11 05:49:54
785
原创 AI芯片知识体系
若做通用编译器开发:核心学 LLVM;若做ML 编译基础设施:核心学 MLIR(统一 IR 与跨层级优化);若做TF + TPU 加速:核心学 XLA;若做跨框架/边缘端 ML 部署:核心学 TVM;趋势:MLIR 正在成为 ML 编译的“统一中间层”,XLA/TVM 等工具均逐步对接 MLIR,LLVM 则始终是底层基石。
2025-12-10 21:00:45
773
原创 一.卷积神经网络
卷积神经网络(CNN)是一种专门处理网格结构数据(如图像、视频)的深度学习模型,核心通过「卷积操作」自动提取数据的局部特征(如边缘、纹理、形状),并结合池化、全连接层完成特征融合与分类 / 回归,是计算机视觉(CV)领域的基石模型。一、核心设计逻辑:模拟人类视觉感知人类看图像时,会先识别局部细节(如线条、色块),再逐步组合成复杂物体(如人脸、汽车)。CNN 复刻这一过程:用卷积层提取局部特征(无需手动设计特征,模型自动学习);用池化层压缩特征维度(减少计算量,保留关键信息);
2025-12-10 15:21:49
754
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅