自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(801)
  • 资源 (14)
  • 收藏
  • 关注

原创 彻底梳理onnxruntime代码(4):session.Run流程、执行compute_func、模型的re-compile

彻底梳理onnxruntime代码(4):session.Run流程、执行compute_func、模型的re-compile

2026-01-05 11:33:03 943

原创 彻底梳理onnxruntime代码(3):CreateSessionAndLoadModel、模型加载、InitializeSession、EP创建与注册、核函数注册、模型编译与优化

彻底梳理onnxruntime代码(3):CreateSessionAndLoadModel、模型加载、InitializeSession、EP创建与注册、核函数注册、模型编译与优化

2026-01-05 11:31:52 664

原创 彻底梳理onnxruntime代码(2): sessionOptions.AppendExecutionProvider、加载后端库、注册核函数

彻底梳理onnxruntime代码(2): sessionOptions.AppendExecutionProvider、加载后端库、注册核函数

2026-01-05 11:29:22 876

原创 彻底梳理onnxruntime代码(1):ortApis代码流程、C与C++接口的关系、怎么获取OrtApiBase结构体

彻底梳理onnxruntime代码(1):ortApis代码流程、C与C++接口的关系、怎么获取OrtApiBase结构体

2026-01-05 11:28:04 846

原创 大模型推理引擎vLLM(0): KV Cache原理

大模型推理引擎vLLM(0): KV Cache原理

2025-12-22 19:14:13 653

原创 Transformer彻底剖析(5):带掩码的多头自注意力与多头编解码注意力、三个注意力模块有什么区别,作用分别是什么

Transformer彻底剖析(5):带掩码的多头自注意力与多头编解码注意力

2025-12-21 08:57:00 862

原创 一个由代码规范性导致的bug:结构体没有memset导致的Segmentation fault (core dumped)

一个由代码规范性导致的bug:结构体没有memset导致的Segmentation fault (core dumped)

2025-12-17 14:34:44 247

原创 Transformer彻底剖析(11):多层感知机MLP

Transformer彻底剖析(11):多层感知机MLP

2025-12-14 16:49:40 362

原创 Transformer彻底剖析(4):注意力为什么要用多头以及为什么有多层注意力

Transformer彻底剖析(4):注意力为什么要用多头以及为什么有多层注意力

2025-12-12 17:21:00 1021

原创 Transformer细节剖析(3):注意力机制为什么要除以根号dk

其实有了前面目录1内容里面的推导了之后,这里就很好理解了,

2025-12-10 11:15:08 331

原创 Transformer彻底剖析(1):GPT中的Transformer架构

Transformer彻底剖析(1):GPT中的Transformer架构

2025-12-06 14:22:53 1002

原创 AI理论知识系统复习(1):交叉熵损失函数

AI理论知识系统复习(1):交叉熵损失函数

2025-11-29 15:51:51 328

原创 Transformer彻底剖析(10): Transformer中用嵌入矩阵的转置作为线性层参数 的问题

Transformer细节剖析(10): Transformer中用嵌入矩阵的转置作为线性层参数 的问题

2025-11-29 15:34:57 242

原创 AI理论知识系统复习(0):梯度饱和、梯度消失、梯度爆炸

梯度饱和、梯度消失、梯度爆炸

2025-11-15 14:32:26 849

原创 英伟达DALI库以及triton的dali_backend相关知识整理

英伟达DALI库以及triton的dali_backend相关知识整理

2025-11-07 18:53:52 787

原创 sherpa-onnx实现ASR(语音转文字)和 TTS(文字转语音)

sherpa-onnx 是开源项目,由 k2‑fsa 组织维护,定位为 “部署框架”中 sherpa 的一个子项目。它的核心目标是:支持“语音处理”相关任务(如:语音识别/ASR、语音合成/TTS、说话人识别/Diarization、VAD、关键词唤醒、语言识别等)在多种设备/平台上本地运行,而无需联网。它使用的是 ONNX 格式模型 + ONNX Runtime 作为推理引擎,从而具备跨平台、较好兼容性的特点。K2 FSA+1。

2025-10-28 13:58:56 1496

原创 Transformer相关疑问笔记:多头/多层注意力、K-V cache、残差、Batch Normal,Layer Normal

Transformer相关疑问笔记:多头,K-V cache、残差、Batch Normal,Layer Normal

2025-09-20 10:17:27 877

原创 用CUDA实现yolov5后处理核函数_decode + nms

用CUDA实现yolov5后处理核函数_decode + nms

2025-09-16 13:52:43 370

原创 一个NVIDIA的简单C++日志打印代码备份

【代码】一个NVIDIA的简单C++日志打印代码备份。

2025-07-30 14:02:59 439

原创 CUDA实现yolov5的后处理

CUDA实现yolov5的后处理以及解决编译和运行错误

2025-07-24 10:42:13 955

原创 CUDA中的内存管理、锁页内存、UVA统一虚拟地址、零拷贝、统一内存

CUDA中的内存管理、锁页内存、UVA统一虚拟地址、零拷贝、统一内存

2025-07-16 11:25:39 1292

原创 Triton Inference Server 架构与前后处理方案梳理

Triton Inference Server 架构与前后处理方案梳理

2025-07-14 14:15:00 1399

原创 在没有网络的容器中安装必要dev包的几种方法

在没有网络的容器中安装必要dev包的几种方法

2025-07-02 10:23:08 940

原创 Triton inference server自定义C++ backend流程

Triton inference server自定义C++ backend流程介绍

2025-06-20 14:59:32 806

原创 triton inference server的backend插件机制代码流程梳理、模型加载代码梳理

triton inference server代码流程梳理、模型加载代码梳理

2025-06-20 14:57:56 1365

原创 Triton server的部署、构建、backend插件机制整体介绍

Triton server的部署、构建、backend插件机制整体介绍

2025-06-20 14:51:54 1886

原创 Triton server的部署、构建、backend插件机制代码梳理、模型加载、自定义C++backend流程

Triton inference server的部署、构建、backend机制代码详细梳理、模型加载过程、自定义C++backend流程.

2025-06-19 15:12:02 280

原创 复习Git命令、Git命令使用流程、VSCode+Git插件管理工程源码

Git命令以及使用流程复习

2025-06-10 08:48:03 1380

原创 VSCode: CreateProcessW failed error:2xx:xx;xx] > posix_spawn: No such file or directory>

VSCode: CreateProcessW failed error:2xx:xx;xx] > posix_spawn: No such file or directory>

2025-06-09 14:37:19 146

原创 简单记录什么是UMD/KMD:UMD就是动态链接库;KMD就是.ko内核驱动模块

简单记录什么是UMD/KMD:UMD就是动态链接库;KMD就是.ko内核驱动模块

2025-06-05 10:12:22 2364

原创 并发编程基础:内存屏障(Memory Barriers)

并发编程基础:内存屏障(Memory Barriers)

2025-05-28 16:33:46 1450

原创 并发编程基础:CPU cache架构、缓存一致性协议详解、MESI

并发编程基础:CPU cache架构、缓存一致性协议详解、MESI

2025-05-27 18:54:38 1173

原创 深度学习算法模型概念整理----模型量化、校准、模型蒸馏、算子、算子融合

深度学习算法模型的几个概念整理----模型量化、校准、模型蒸馏、算子、算子融合。

2025-05-26 17:46:56 1425 2

原创 C++线程池----基于生产者消费者模式队列实现

C++线程池----基于生产者消费者模式队列实现

2025-05-22 17:39:47 500

原创 微服务架构中的多进程通信--内存池、共享内存、socket

微服务架构中的多进程通信--内存池、共享内存、socket

2025-05-20 14:19:21 1374

原创 记录帮同事编译RK3588上面的C++工程时遇到的若干问题以及解决方法和步骤

记录帮同事编译RK3588上面的C++工程时遇到的若干问题以及解决方法和步骤

2025-05-15 12:20:23 1412

原创 记录一次老程序员纯靠直觉和猜测把问题解决的过程----获取君正T41开发板上摄像头图像

获取君正T41开发板上摄像头图像

2025-04-29 10:56:24 589

原创 算能BM1684升级为BM1688: tpu_mlir转换模型_SDK更新_代码修改_问题排查_代码调试

算能BM1684升级为BM1688:tpu_mlir工具做模型转换_SDK更新_代码修改_错误解决

2025-04-25 11:03:25 1197

原创 AI代码编辑器cursor的安装、核心功能、使用技巧

AI代码编辑器cursor的安装、核心功能、使用技巧

2025-04-18 10:37:25 1155

原创 一个由通义千问以及FFmpeg的AVFrame、buffer引起的bug:前面几帧影响后面帧数据

一个由通义千问以及FFmpeg的AVFrame、buffer引起的bug:前面几帧影响后面帧数据

2025-04-16 18:14:14 684

瑞芯微RV1126开发板算法移植说明文档-环境搭建-opencv交叉编译-C++推理代码-yolov5算法移植-分类算法移植-人脸检测识别算法移植

环境搭建:介绍了安装连接工具、RKNN-Toolkit工具包和交叉编译工具链的步骤。 在PC上仿真运行示例:提供了在PC上运行仿真示例的指导。 在开发板上运行demo:指导如何在开发板上运行demo。 YOLOv5算法移植:详细说明了将YOLOv5模型转换为RKNN模型的过程,包括模型预编译、修改C++代码、编译运行和性能测试。 RepVGG算法移植:介绍了算法模型转换、编译运行和性能测试的步骤。 YOLOv5-Face算法移植(人脸检测):包括模型转换、C++代码修改、驱动升级、人脸检测效果图和性能测试。 口罩检测算法移植(YOLOv5s-5.0):介绍了模型转换的步骤。 人脸检测及识别算法移植:涵盖了人脸检测算法移植(blazeface)、人脸识别算法移植、人脸布控数据库、交叉编译数据库和比对结果。 人车非检测算法移植(YOLOv5n):包括模型转换、C++代码和性能测试。

2025-01-16

pytorch学习视频百度网盘链接.txt

pytorch学习视频,2.5个G。包括 深度学习初见/ 开发环境安装/ 回归问题/ pytorch基础教程/ pytorch进阶教程/ 随机梯度下降/ 神经网络与全连接层/ 过拟合/ 卷积神经网络CNN/ CIFAR10与resnet实战/ 循环神经网络RNN&lstm/

2020-02-23

PCA特征值压缩原理.docx

PCA降维原理,包含基本的线性代数基础知识,以及降维的原理,和降维矩阵的求解方法。。。。。。。。。。。。。。。。。。。。。。。

2020-08-31

君正T41芯片交叉编译工具链

君正T41芯片交叉编译工具链

2024-08-01

华为ascend平台模型转换工具和脚本

华为ascend平台模型转换工具和脚本,用于将深度学习算法模型转换为华为平台的.om格式模型。

2024-05-09

HiSVP API 参考.pdf

海思3559a的SVP开发手册,可以用来开发海思3559a的NNIE,HiSVP API 参考.pdf

2019-07-11

SDC APP开发指南.pdf

海思3559a的SDC APP开发指南,内含有SDC接口介绍以及简单demo,SDC APP开发指南.pdf

2019-07-11

HI3559a的各种资料百度网盘链接.txt

含有HI3559a的各种资料,手册,交叉编译工具链,各种工具,软硬件设计资料,一共九个多G

2019-07-11

activeMQ收发工具.rar

activeMQ的测试工具,用于发送和接收activeMQ消息,jar包形式的,安装完jdk之后用java -jar xxx.jar命令运行

2021-11-24

HI3536交叉编译工具链.txt

Hi3536交叉编译工具链的资源和安装方法的百度云网盘链接,链接永久有效

2020-08-21

个人工作总结汇报PPT模板

105套个人工作总结汇报PPT模板,前70套

2020-12-24

ndjpnladcallmjemlbaebfadecfhkepb.zip

chrome浏览器的office插件,支持在线编辑office,这样可以在linux中的google浏览器使用office,

2020-08-04

2020-07-24-21-20-52-download-P3X-OneNote-2020.10.105.AppImage

linux上安装的P3X-OneNote,网络下载太慢,因此上传供同学下载,安装后可以在linux上使用onenote

2020-08-04

httpclient.zip

httpclient的demo,用于向服务器发送http请求,在项目中用过,可用

2019-07-11

105套个人工作总结汇报PPT模板,

105套个人工作总结汇报PPT模板,下,71-105套

2020-12-24

yuvviewer,yuv播放器

yuvviewer,yuv播放器,支持播放各种格式的yuv,nv12,nv,i420

2020-12-16

ucos2官方资料

ucos源码

2014-08-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除