自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(126)
  • 收藏
  • 关注

原创 gpu性能

相关网址相关显卡算力对比浮点计算性能测试FLOPS 与FLOPs 的区别A100 文档阅读A800 文档阅读显卡系列知识。

2024-10-14 09:15:54 800 1

原创 onnx底层入门

架构报错onnx 模型调试pytorch 成功转换为onnx 模型的条件案例:缺少 映射关系案例: 缺少映射关系案例: 自定义torch 算子案例: debug 每一层,判定前后精度是否损失。

2024-10-11 17:18:29 1011

原创 onnx代码解读

torch.jit.trace 相关代码解读onnx 内部实现3 查看是否为aten 算子aten 算子实现torch.autograd.Functions 算子实现自定义算子实现查找未实现的节点一次性发现所有的未实现 aten 算子。

2024-10-11 17:12:54 304

原创 FAIL : Failed to load library libonnxruntime_providers_cuda.so with error: libcublasLt.so.11: cannot

安装: conda install cudatoolkit。

2024-09-26 14:13:30 271

原创 1Torch was not compiled with flash attention. (Triggered internally at C:\actions-r unner_work\pytor

改为: pip install torch。解决: 降低torch版本,

2024-09-25 16:32:28 649

原创 ImportError: DLL load failed while importing onnx_cpp2py_export :动态链接库(DLL)初始化历程失败

解决:先说解决办法:将1.16.2版本的onnx降级为1.16.1。

2024-09-19 17:44:04 711

原创 OpenAI 使用教程

openAI 使用教程。

2024-09-14 13:50:09 288

原创 UnicodeEncodeError: ‘latin-1‘ codec can‘t encode characters in position 41-44: Body (‘学术快报‘) is not

需要修改json 的 编码方式。

2024-09-13 10:58:28 400

原创 ValueError: check_hostname requires server_hostname

这种时候可能是你开了vpn连接了外网,关掉vpn即可。

2024-09-12 10:46:13 253

原创 flask下https教程

linux 下flask https 协议。

2024-09-09 19:02:30 564

原创 文本文件完整性判断-加密

文件加密。

2024-09-03 16:36:23 296

原创 flask文件下载

【代码】flask文件下载。

2024-09-03 16:32:59 607

原创 gitlab使用教程

pycharm 克隆代码pycharm 克隆分支type 提交指令使用可视化界面SourceTreepycharm中git 基本使用获取和拉取的区别,update project 区别sourceTree 回退版本sourceTree 回滚代码。

2024-08-26 17:12:49 938

原创 from llama_index.embeddings.huggingface import HuggingFaceEmbedding

一、定义。

2024-08-19 17:32:39 410

原创 AssertionError: daemonic processes are not allowed to have children

DataLoader(dataset=mydataset,batch_size=20,shuffle=True,num_workers=0,collate_fn=collator,drop_last=False) 将num_workers 改为0。

2024-08-19 15:24:11 344

原创 大模型微调工具-torchtune

1.定义2.安装3. 案例。

2024-08-08 14:28:23 1268

原创 大模型QAT量化

定义案例。

2024-08-07 16:07:00 252

原创 量化方法介绍

分类模型量化接口进阶量化支持的模式/流/硬件。

2024-08-07 15:10:43 267

原创 torch量化接口深度解读-eager模式-fx模式

接口总结量化模式解读。

2024-08-07 14:34:26 1250

原创 模型量化-debug工具-eager模式

目的量化错误类型静态量化dubug 工具动态量化debug 工具接口解读量化常见错误。

2024-08-07 10:06:42 842

原创 模型量化进阶-钩子使用

1.定义2. 案例。

2024-08-07 09:56:49 289

原创 pycuda

1.定义2. 案例3. pycuda 调用c++,并在内核中执行4. 接口。

2024-07-25 17:23:17 300

原创 TensorRT入门

安装部署教程使用方法案例1案例2使用torch2trt 直接转换。

2024-07-25 13:50:57 444

原创 torch.fx模型量化进阶

定义案例-图-算子追踪算子替换新建算子并替换子图替换fx 模型量化接口解读。

2024-07-24 14:20:56 387

原创 torchscript接口

定义script、eager、onnx 模式对比案例生成的模型可以被c++调用接口解读。

2024-07-24 14:13:31 391

原创 torchviz工具入门

定义部署案例二、实现定义TorchViz是一个用于可视化 PyTorch计算图的工具库,查看模型结构、以及算子流向图。文档:https://graphviz.org/部署1. 安装torchviz安装graphviz.exe下载:https://graphviz.gitlab.io/_pages/Download/Download_windows.html打开cmd(win+R,输入cmd) ,或者打开Anaconda Promopt。

2024-07-22 09:04:38 395

原创 pytorch钩子函数

定义案例1-分析某一层结果案例2-挂载到模型上,分析每一层参数案例3-挂载到fc层反向传播上,增加噪音模块可视化。

2024-07-21 11:10:50 561 1

原创 模型剪枝入门

1.定义2. 案例13. 全局剪枝案例4. 全局剪枝案例5. 自定义剪枝6. 特定网络剪枝7. 多参数模块剪枝8. torch.nn.utils.prune 解读。

2024-07-21 11:04:16 331

原创 分布式启动入门

定义案例。

2024-07-17 11:18:54 619

原创 QLoRa使用教程

【代码】QLoRa使用教程。

2024-07-16 18:07:32 347

原创 torch.amp自动混合精度包

定义案例。

2024-07-16 13:56:19 262

原创 72B大模型分片部署

目的官方教程案例小模型修改device_map 方式二。

2024-07-16 10:34:00 502

原创 torch.compile模型编译加速

定义接口介绍案例。

2024-07-15 16:05:37 662

原创 cuda缓存示意图

cuda 缓存示意图gpu 架构示意图gpu 内存访问示意图。

2024-07-15 11:44:13 386

原创 pageAttention学习

定义paged attention_v2 使用vllm 中 flash attention 代码xformer中flash attention 代码paged attention 、flash attention 比较nsight compute 分析paged attentionprofiler 分析paged attention二、实现定义paged attention_v2 使用vllm 中paged attention 是使用cuda 使用的,如下图。

2024-07-15 11:41:26 1224

原创 GPU内存快照分析工具

定义案例-使用方法案例。

2024-07-15 11:18:05 472

原创 profiler进阶

gpu summary 分析trace 跟踪视图 分析每个算子用时分析gpu 内核利用率分析内存分析内存快照,进行分析。

2024-07-15 11:12:40 792

原创 profiler模型性能分析与优化入门

profiler 作用入门pyproftorch.summary/torchinfo 模型参数量分析以及模型可视化profiling 参数分析-模型分析分析某一个算子做内存快照。

2024-07-15 11:03:36 417

原创 torch.autograd.profiler分析工具

案例。

2024-07-12 15:53:32 555

原创 nsightcompute进阶

1 python 代码测试2 roofline analysis 屋檐模型分析3 summary 分析4 Speed of light throughput 分析5 带宽分析6 内存分析。

2024-07-12 14:57:56 1238

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除